Does Long-Term Series Forecasting Need Complex Attention and Extra Long Inputs?

Liang, Daojun; Zhang, Haixia; Yuan, Dongfeng; Ma, Xiaoyan; Li, Dongyang; Zhang, Minggao

计算机科学>机器学习

arXiv:2306.05035（cs）

【于2023年6月8日提交(第1版)，最新修订日期：2024年2月4日（本版本，第3版）]

职务：长期序列预测需要复杂关注和超长输入吗？

作者：梁道军,张海霞,东风园,马晓燕,李东阳,张明高

查看PDF

摘要：随着基于变换的模型在各种时间序列任务上取得了令人印象深刻的性能，长期序列预测（LTSF）任务近年来也受到了广泛关注。然而，由于基于Transformer的方法固有的计算复杂性和长序列要求，其在LTSF任务中的应用仍有两个主要问题需要进一步研究：1）这些方法设计的稀疏注意机制是否真的减少了实际设备上的运行时间；2）这些模型是否需要超长的输入序列来保证性能？本文给出的答案是否定的。因此，为了更好地复制这两个问题，我们设计了一个轻量级的周期关注机制（Periodformer），该机制通过显式周期性更新了长期子序列的聚合，通过内置的邻近性更新了短期子序列。同时，Periodformer中嵌入了一个门控机制来调节注意模块对预测结果的影响。此外，为了充分利用GPU进行快速超参数优化（例如，找到合适的输入长度），提出了一种基于贝叶斯优化（Bayesian optimization，MABO）的多GPU异步并行算法。MABO通过队列机制为每个GPU分配一个进程，然后一次创建多个试用，用于异步并行搜索，这大大减少了搜索时间。与现有方法相比，多变量和单变量预测的Periodformer预测误差分别降低了13%和26%。此外，MABO在寻找更好的超参数的同时，将平均搜索时间减少了46%。总之，本文表明LTSF可能不需要复杂的注意和超长的输入序列。该代码已在Github上开源。

评论：	正在审查中
学科：	机器学习（cs.LG）
引用为：	arXiv公司：2306.05035【cs.LG】
	（或 arXiv:2306.05035v3【cs.LG】对于此版本）
	https://doi.org/10.48550/arXiv.2306.05035

提交历史记录

发件人：梁道军[查看电子邮件]
[第1版]2023年6月8日星期四08:37:49 UTC（1351 KB）
[版本2]2023年6月13日星期二03:59:26 UTC（1412 KB）
[第3版]2024年2月4日星期日04:42:26 UTC（1171 KB）

计算机科学>机器学习

职务：长期序列预测需要复杂关注和超长输入吗？

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>机器学习

职务：长期序列预测需要复杂关注和超长输入吗？

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目