解读顶会 CIKM'21 Historical Inertia 论文
摘要:本文(Historical Inertia: An Ignored but Powerful Baseline for Long Sequence Time-series Forecasting)是由华为云数据库创新 Lab 联合电子科技大学数据与智能实验室发表在顶会 CIKM’21 的短文,该文章提出了一种针对长时间序列的 baseline。
本文分享自华为云社区《CIKM'21 Historical Inertia论文解读》,作者: 云数据库创新 Lab 。
导读
本文(Historical Inertia: An Ignored but Powerful Baseline for Long Sequence Time-series Forecasting)是由华为云数据库创新 Lab 联合电子科技大学数据与智能实验室发表在顶会 CIKM’21 的短文,该文章提出了一种针对长时间序列的 baseline。CIKM 是信息检索和数据挖掘领域顶级学术会议之一。本届会议共收到短文投稿 626 篇,其中录用论文 177 篇,录取率约为 28% 。该论文是云数据库创新 LAB 在时序分析层面取得的关键技术成果之一。
1、摘要
长序列时间序列预测(Long Sequence Time-series Forecasting,LSTF)因其广泛的应用而变得越来越流行。虽然人们已经提出了大量复杂模型来提高预测的有效性和效率,但却忽视或低估了时间序列一个最自然、最基本的特性:历史存在惯性。在本文中,我们提出了一个新的 LSTF 基线,即历史惯性(Historical Inertia, HI)。在此基线模型中, 我们直接将输入时间序列中距离预测目标最近的历史数据点作为预测值。我们在 4 个公开 LSTF 数据集,2 个 LSTF 任务上评估了 HI 的效果,结果表明,与 SOTA 工作相比,HI 可以获得高达 82%的相对提高。同时,我们也讨论了 HI 和现有方法结合的可能性。
2、HI
HI 直接将输入时间序列中距离预测目标最近的历史数据点作为预测值。
3、实验
3.1 单变量长时间序列预测结果
对于单变量长时间序列预测任务,HI 在 ETTh1 和 ETTm1 数据集上显著优于 SOTA 模型。Informer 及其变体主导了 ETTh2 数据集的最优结果。而对于 Electricity 数据集,HI,Informer 和 DeepAR 都有较好的表现。整体来看,HI 在 MSE 和 MAE 上分别实现了高达 80%和 58%的相对提高。
3.2 多变量长时间序列预测结果
对于多变量长时间序列预测任务,HI 在四个数据集的绝大多数预测任务上都显著优于 SOTA 模型,最高带来了 82%的相对提高。
4、讨论
4.1 为什么 HI 会有如此好的效果
我们从两个角度考虑了 HI 能取得良好效果的原因:
数值 :HI 可以保证预测序列与真实序列有相似的数值大小。
周期性:对于有周期性且周期性较短的数据集,HI 可以做到预测序列与真实序列相位相似。
4.2 如何利用 HI
我们提出了两种利用 HI 的可能方向
融合模型(Hybrid model):可以考虑将 HI 与其他模型融合,例如简单的作为一种 trick 将输出结果加权平均。
自动机器学习(AutoML):某些情况下复杂模型可能并不能达到良好效果,因此可以考虑根据数据自适应模型结构,适当地降低/增加模型复杂度。
对于融合模型这一方向,我们设计了简单的实验予以验证:将 HI 与 2 层 MLP 模型的输出结果取平均得到最终预测结果。实验结果表明,融合 HI 的 MLP 模型可实现更准确的预测,并且此优势在单变量长时间序列预测任务上更显著。
华为云数据库创新 lab 官网:https://www.huaweicloud.com/lab/clouddb/home.html
版权声明: 本文为 InfoQ 作者【华为云开发者社区】的原创文章。
原文链接:【http://xie.infoq.cn/article/52cc1eb979c522f522ba44f65】。文章转载请联系作者。
评论