摘要: 本文以航司乘客数预测的例子来组织相关时间序列预测的代码,通过了解本文中的代码,当遇到其它场景的时间序列预测亦可套用。 航司乘客数序列 预测步骤 # 加载时间序列数据 _ts = load_data() # 使用样本熵评估可预测性 print(f'原序列样本熵:{SampEn(_ts.values, 阅读全文
posted @ 2020-06-16 09:32 程序员一一涤生 阅读(3113) 评论(3) 推荐(0) 编辑
摘要: 本篇介绍时间序列预测常用的ARIMA模型,通过了解本篇内容,将可以使用ARIMA预测一个时间序列。 什么是ARIMA? ARIMA是'Auto Regressive Integrated Moving Average'的简称。 ARIMA是一种基于时间序列历史值和历史值上的预测误差来对当前做预测的模 阅读全文
posted @ 2020-06-16 09:30 程序员一一涤生 阅读(25024) 评论(2) 推荐(2) 编辑
摘要: 如果想知道一个序列是否对预测另一个序列有用,可以用Granger causality test(格兰杰因果检验)。 Granger causality test的思想 如果使用时间序列X和Y的历史值来预测Y的当前值,比仅通过Y的历史值来预测Y的当前值得到的误差更小,并且通过了F检验,卡方检验,则X对 阅读全文
posted @ 2020-06-10 09:30 程序员一一涤生 阅读(10663) 评论(0) 推荐(1) 编辑
摘要: 本文介绍一种方法,帮助我们了解一个时间序列是否可以预测,或者说了解可预测能力有多强。 Sample Entropy (样本熵) Sample Entropy是Approximate Entropy(近似熵)的改进,用于评价波形前后部分之间的混乱程度, 熵越大,乱七八糟的波动越多,越不适合预测;熵越小 阅读全文
posted @ 2020-06-10 09:28 程序员一一涤生 阅读(2174) 评论(0) 推荐(0) 编辑
摘要: 经典的时间序列预测方法都是假设如果一个时间序列有显著的自相关性,那么历史值对预测当前值会很有帮助,但是究竟取多少阶的历史值,就需要通过分析相关函数图和偏相关函数图来得到。本文介绍如何什么是相关函数图和偏相关函数图,另外还会介绍一下滞后图。 什么是自相关和偏自相关函数? 先来解释下滞后阶数n,如果当前 阅读全文
posted @ 2020-06-08 20:17 程序员一一涤生 阅读(5999) 评论(0) 推荐(0) 编辑
摘要: 有的时候,一些时刻或连续时间段内的值无法采集到,或者本身就没有值,本文将介绍如何处理这种情况。 一般而言,有以下几种方法: 对所有的缺失值用零填充。 前向填充:比如用周一的值填充缺失的周二的值 后向填充:比如用周二的值填充缺失的周一的值 采用n最近邻均值法填充:比如n取2,则用t-2,t-1,t+1 阅读全文
posted @ 2020-06-08 20:06 程序员一一涤生 阅读(3809) 评论(0) 推荐(0) 编辑
摘要: 上篇文章简单提到了应该用平稳时间序列做预测,本文将介绍具体概念和原因。 Stationary Series 平稳序列 平稳序列有三个基本标准: 1、序列的均值(mean)不应该是时间的函数(意思是不应该随时间变化),而应该是一个常数。下面的左图满足这个条件,而右图的均值受时间的变化影响。 2、序列的 阅读全文
posted @ 2020-06-02 16:39 程序员一一涤生 阅读(3626) 评论(0) 推荐(0) 编辑
摘要: 在初始概念篇中,我们简单提到了时间序列由趋势、周期性、季节性、误差构成,本文将介绍如何将时间序列的这些成分分解出来。分解的使用场景有很多,比如当我们需要计算该时间序列是否具有季节性,或者我们要去除该时间序列的趋势和季节性,让时间序列变得平稳时都会用到时间序列分解。 加法和乘法时间序列 时间序列的各个 阅读全文
posted @ 2020-06-02 16:37 程序员一一涤生 阅读(4659) 评论(0) 推荐(0) 编辑
摘要: 本文将介绍如何通过python来读取、展现时间序列数据。 读取 时间序列数据一般用cvs等电子表格的形式存储,这里以cvs为例: from dateutil.parser import parse from datetime import datetime import matplotlib as 阅读全文
posted @ 2020-06-02 16:36 程序员一一涤生 阅读(1795) 评论(0) 推荐(0) 编辑
摘要: 利用时间序列预测方法,我们可以基于历史的情况来预测未来的情况。比如共享单车每日租车数,食堂每日就餐人数等等,都是基于各自历史的情况来预测的。 什么是时间序列? 时间序列,是指同一个变量在连续且固定的时间间隔上的各个数据点的集合,比如每5分钟记录的收费口车流量,或者每年记录的药物销量都是时间序列。 时 阅读全文
posted @ 2020-06-02 16:33 程序员一一涤生 阅读(2187) 评论(0) 推荐(0) 编辑