《DeepAR: Probabilistic Forecasting with Autoregressive Recurrent Networks》

Abstract

       在本文中,提出了DeepAR,一种基于大量相关时间序列的自回归循环网络模型的概率预测方法。我们演示了如何应用深度学习技术来预测,可以克服当前广泛使用的经典方法的所面临的问题。我们通过对几个真实世界的预测数据集进行广泛的实证评估表明,与最先进的方法相比,预测精度提高了15%左右。

 

 

1 Introduction

       首先就是介绍时间预测的重要性,并举了一些例子。

      然后就是分析当前流行预测方法的流程,这些方法是应用于单独时序或者小规模时序的。模型参数是根据历史观测值单独估计的,面对不同的现实因素,模型需要手动选择。根据模型动态,使用拟合模型预测未来的时间序列,也可能通过模拟或预测分布的闭式表达式进行概率预测。该类中的许多方法基于经典的Box-Jenkins方法、指数平滑法状态空间模型

    【闭式表达式:闭式表达式是这样一个表达式,它由初等函数经过有限次的初等运算复合而成】

      提出新的时序预测问题:使用海量的相关数据对单序列进行预测,这种预测模型既可以拟合更加复杂的问题,也可以减少过拟合,还可以减少特征工程和选择模型的工作。

      随即引出我们的DeepAR,基于自回归RNN,采用LSTM。

       时序预测中遇到一个问题就是样本量级差异,销售数量多一个数量级,商品数量就少一个数量级,近似幂律,具有无标度特性。就这个log-log图的意思。这给通过划分子序列来研究以及基于组的正则化和一些标准化技术带来负面阻碍:很难按照数量级的不同分组训练模型,因为无法保证这样分组情况下,组内的序列具有相同的偏度。标准化、批量归一化和正则化的手段都将失效。

       本文的贡献:提出RNN预测模型,对实值数据采用高斯分布似然,对计数数据采用负二项式似然,并对时间序列幅度变化较大的情况进行了特殊处理;

       优势:更好的预测精度;当模型学习季节性行为和对时间序列中给定协变量的依赖性时,需要最少的人工特征工程来捕获复杂的、群体依赖行为;DeepAR以蒙特卡罗采样的形式进行概率预测,可用于计算预测范围内所有子范围的连续分位数估计(iii)通过从相似项目中学习,对几乎没有历史记录的项目提供预测(vi)不假设高斯噪声,但可以包含广泛的似然函数,允许用户选择一个适合数据统计特性的函数。

        上述的优势既有对传统经典方法的优越,也有概率分布预测对点预测的优越。

 

2 Related Work

3 Model

 

 

 

        

posted @ 2021-07-31 16:27  臭农图不灵  阅读(534)  评论(0)    收藏  举报