时间序列预测是一个至关重要的任务,它为经济规划、供应链管理和医学诊断等各个领域的决策提供了关键信息。过去,传统统计方法和机器学习曾被广泛应用于时间序列预测问题,然而,随着多种基础的深度学习架构如多层感知机(MLP)、卷积神经网络(CNN)、递归神经网络(RNN)和图神经网络(GNN)的发展,这些架构被逐步应用于时间序列预测问题的解决。然而,由于每种深度学习架构的归纳偏置所带来的结构性限制,它们的性能也受到了制约。变换器模型(Transformer),擅长处理长期依赖关系,已经成为时间序列预测中的重要架构组件。然而,近期的研究表明,简单的线性层等替代方案能够超越变换器模型。这些发现为使用多样化架构提供了新的可能性。在探索各种模型的背景下,时间序列预测的架构建模已经进入了一个复兴阶段。本综述不仅为时间序列预测提供了历史背景,还对向架构多样化发展的趋势进行了全面而及时的分析。通过比较和重新审视多种深度学习模型,我们揭示了新的视角,并呈现了时间序列预测中的最新趋势,包括混合模型、扩散模型、Mamba模型和基础模型的出现。通过聚焦时间序列数据的内在特性,我们还讨论了时间序列预测中受到关注的开放挑战,如通道依赖性、分布变化、因果关系和特征提取等。本综述探讨了通过多样化方法提升预测性能的关键要素。这些贡献有助于降低新入门者进入时间序列预测领域的门槛,同时为经验丰富的研究者提供了广阔的视野、新的机会和深刻的见解。
关键词:时间序列预测,深度学习,基础模型,分布变化,因果关系
1 引言
时间序列预测(Time Series Forecasting, TSF)是一个基于历史数据序列预测未来值的任务(Cryer, 1986)。它作为各个领域的关键决策工具,广泛应用于经济与金融、供应链管理、交通运输、能源、气象和医疗保健等领域(Danese 和 Kalchschmidt, 2011;Abu-Mostafa 和 Atiya, 1996;Alghamdi 等, 2019;Nti 等, 2020;Dimri 等, 2020;Soyiri 和 Reidpath, 2013)。这些应用提供了诸多机会,包括降低成本、提高效率和增强竞争力(Danese 和 Kalchschmidt, 2011)。然而,时间序列数据固有的多样性和复杂性使得预测变得极具挑战性。除了显而易见的信息外,各种隐藏的模式使得学习时间依赖关系变得更加困难,而在某些时候不规则的值进一步加剧了这一问题。在多变量问题中,诸如通道相关性等额外因素使得任务变得更加复杂(见第2.1节)。此外,时间序列数据因领域的不同而展现出不同的特征,数据采集的时间和环境也导致了显著不同的模式(见第2.3节)。因此,TSF问题通常具有有限的模型泛化能力,需要多样化的架构和方法。日益复杂的TSF问题给研究人员带来了更大的挑战,近期这也促使了新方法和算法的积极发展,以应对这些问题(Lim 和 Zohren, 2021)。
在主要的人工智能和机器学习会议上接受的论文数量急剧增加(见图2),证明了TSF研究在人工智能和机器学习领域的重要性不断上升。随着越来越多的研究致力于解决时间序列预测问题,综述性论文也频繁发表(见表1)。随着时间的推移,许多综述性论文系统地整理了TSF的广泛领域,提供了深入的研究,给研究人员提供了宝贵的指导和方向。然而,现有的综述论文仍有改进的空间,特别是在应对模型多样性日益增加和领域中的开放挑战方面。
TSF模型经历了长时间的发展。过去,主要使用基于移动平均的统计方法,后来发展成了传统方法,如指数平滑和自回归综合滑动平均(ARIMA)(Bartholomew, 1971)。机器学习技术,如决策树模型(Quinlan, 1986)和支持向量机(SVM)(Cortes, 1995),也曾被广泛应用,但它们在学习复杂的非线性模式方面存在局限性(见第3.1节)。随着可用数据量的增加和硬件计算能力的提升,各种深度学习架构如多层感知机(MLP)(Rumelhart 等, 1986)、递归神经网络(RNN)(Hopfield, 1982)、卷积神经网络(CNN)(LeCun 等, 1998)和图神经网络(GNN)(Scarselli 等, 2008)被开发出来,能够学习更复杂的模式。然而,这些早期的深度学习架构的性能受限于它们的内在设计。为了克服这些结构性限制,像长短期记忆网络(LSTM)(Hochreiter 和 Schmidhuber, 1997a)和时序卷积网络(TCN)(Bai 等, 2018)等变种被广泛应用(见第3.2节)。变换器(Transformer)(Vaswani, 2017)因其处理长期依赖关系的能力,在自然语言处理领域表现出色,随后也自然地扩展到时间序列数据。尽管变换器在TSF中表现良好并且广泛流行,但近期的研究表明,简单的线性模型也可以超越变换器模型(见第3.3节)。因此,重新审视传统深度学习方法的兴趣显著增加,并且对各种架构(如基础模型、扩散模型和Mamba模型等)产生了越来越多的关注(见第4.2、4.3、4.4、4.5节)。变换器模型仍在持续改进,并在TSF中扮演着重要角色(见第4.1节)。因此,TSF进入了一个建模的复兴阶段,各种方法正在积极竞争,且没有任何单一方法占据主导地位(见图3)。在这种背景下,本综述具有两个主要优点,使其与以往的TSF综述论文区别开来。
首先,我们关注架构多样性的不可避免性,提供了一个及时和全面的视角,帮助理解当前架构多样化的趋势。现有的TSF综述论文,如(Wen 等, 2022a;Zhang 等, 2024c;Lin 等, 2024a;Meijer 和 Chen, 2024;Patro 和 Agneeswaran, 2024a),主要集中在对特定架构的详细分析,但在广泛比较多样化架构,包括新兴架构方面存在局限性。本论文系统地比较了各种架构(MLP、CNN、RNN、GNN、Transformer、扩散模型、基础模型、Mamba)的发展进展,并分析了每种架构的优缺点和贡献。此外,本文还探讨了结合多种架构优点的混合模型的性能,清晰地展示了TSF中的关键趋势。通过这些贡献,读者能够有效地理解该领域不断发展的趋势和方向。通过这一方式,它降低了新入门者进入TSF领域的门槛,并为经验丰富的研究人员提供了广阔的视野和新的研究机会。
其次,我们从开放挑战的角度进行探讨。尽管许多先进的架构已经解决了许多问题,但TSF中的核心挑战仍然存在。特别是,通道相关性、分布变化、因果关系和特征提取等问题(见第5节)依然是需要解决的重要挑战(见图4)。本综述探讨了旨在解决这些挑战的最新方法,并为读者提供了宝贵的解决问题的见解。尽管先前的综述提供了有关开放挑战的有用视角,但它们在这些问题的探讨深度上有所不足。本综述旨在弥补这一空白,提供更为全面的分析并提出新的解决方案。
本综述首先介绍了时间序列数据的基本概念和预测问题定义(第2节),然后回顾了过去方法的发展历程(第3节)。在第4节中,分析了最新模型的关键特征,最后在第5节中,探讨了TSF中的开放挑战及其解决方案。通过这些内容,读者将获得对TSF研究过去和现在的广泛理解,并为未来的研究提供新的思路。
大模型&AI产品经理如何学习
求大家的点赞和收藏,我花2万买的大模型学习资料免费共享给你们,来看看有哪些东西。
1.学习路线图
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
2.视频教程
网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。
(都打包成一块的了,不能一一展开,总共300多集)
因篇幅有限,仅展示部分资料,需要点击下方图片前往获取
3.技术文档和电子书
这里主要整理了大模型相关PDF书籍、行业报告、文档,有几百本,都是目前行业最新的。
4.LLM面试题和面经合集
这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓