# ${\rm ARIMA}$ 模型

## 滞后算子

• $\mathscr{B}X_t=X_{t-1}$
• $\mathscr{B}^2X_t=\mathscr{B}(\mathscr{B}X_t)=\mathscr{B}(X_{t-1})=X_{t-2}$

• $m$ 阶滞后算子多项式：

$B(\mathscr{B})=b_0+b_1\mathscr{B}+b_2\mathscr{B}^2+\cdots+b_m\mathscr{B}^m=\sum_{i=0}^mb_i\mathscr{B}^i \ .$

• 无穷阶滞后算子多项式：

$B(\mathscr{B})=b_0+b_1\mathscr{B}+b_2\mathscr{B}^2+\cdots=\sum_{i=0}^\infty b_i\mathscr{B}^i \ .$

• 特别地，若 $|\varphi|<1$ ，根据 Taylor 级数计算公式有：

$\frac{1}{1-\varphi\mathscr{B}}=1+\varphi\mathscr{B}+\varphi^2\mathscr{B}^2+\varphi^3\mathscr{B}^3+... \ .$

## ${\rm MA}(q)$ 模型

### ${\rm MA}(1)$ 模型

$y_t=u_t+\theta u_{t-1} \ ,$

$u_t\sim{\rm WN}(0,\,\sigma^2) \ .$

• ${\rm E}(y_t)=0$
• ${\rm Var}(y_t)=(1+\theta^2)\sigma^2$
• $\gamma(k)={\rm Cov}(y_t,\,y_{t+k})={\rm E}[(u_t+\theta u_{t-1})(u_{t+k}+\theta u_{t+k-1})]= \left\{ \begin{array}{lll} \theta\sigma^2 &, & k=1\\ 0 &,& k\geq2 \end{array} \right.$ .

$\rho(k)=\frac{\gamma(k)}{\gamma(0)}= \left\{ \begin{array}{lll} \dfrac{\theta}{1+\theta^2} &, & k=1\\ 0 &,& {\rm otherwise} \end{array} \right. \ .$

$y_t=(1+\theta\mathscr{B})u_t \ ,$

$\dfrac{y_t}{1+\theta\mathscr{B}}=u_t \ ,$

$y_t=u_t-(-\theta)y_{t-1}-(-\theta)^2y_{t-2}-\cdots \ .$

• $y_t=\beta_0+\beta_1y_{t-1}+\varepsilon_t$ ,

• $p(1)=\hat\beta_1\approx\theta$ .

• $y_t=\beta_0+\beta_1y_{t-1}+\cdots+\beta_ky_{t-k}+\varepsilon_t$ ,

• $p(k)=\hat\beta_k\approx(-1)^{k+1}\theta^k$ .

• $\theta>0$ 则 PACF 上下摆动收敛于 $0$
• $\theta<0$ 则 PACF 恒为负并递增收敛于 $0$

### ${\rm MA}(q)$ 模型

$y_t=u_t+\theta_1u_{t-1}+\theta_2u_{t-2}+\cdots+\theta_qu_{t-q} \ ,$

$u_t\sim{\rm WN}(0,\,\sigma^2) \ .$

• ${\rm E}(y_t)=0$ ;
• ${\rm Var}(y_t)=(1+\theta_1^2+\cdots+\theta_q^2)\sigma^2$ ;
• 自协方差函数：

$\gamma(k)={\rm Cov}(y_t,\,y_{t+k})= \left\{ \begin{array}{lll} (\theta_1+\theta_2\theta_1+...+\theta_q\theta_{q-1})\sigma^2 &, & k=1 \\ \cdots && \\ (\theta_{q-1}+\theta_q\theta_1)\sigma^2 &,& k=q-1\\ \theta_q\sigma^2&,&k=q \\ 0 &,& k>q \end{array} \right.$

$\Theta(z)=\sum_{i=0}^q\theta_iz^i\neq0\ , \ \ \ \ |z|\leq1 \ .$

## ${\rm AR}(p)$ 模型

### ${\rm AR}(1)$ 模型

$y_t=\phi y_{t-1+}\varepsilon_t \ ,$

$\varepsilon_t\sim{\rm WN}(0,\,\sigma^2) \ .$

• ${\rm E}(y_t)=0$ ;
• ${\rm Var}(y_t)=\dfrac{\sigma^2}{1-\phi^2}$ .

$y_ty_{t-k}=\phi y_{t-1}y_{t-k}+\varepsilon_ty_{t-k} \ ,$

$k\geq1$ ，两边同时取数学期望：

${\rm E}(y_ty_{t-k})=\phi {\rm E}(y_{t-1}y_{t-k})+{\rm E}(\varepsilon_ty_{t-k}) \ ,$

$\gamma(k)=\phi\gamma(k-1) \ .$

${\rm AR}(1)$ 模型的两边同时乘一个 $y_{t}$ 并取数学期望

${\rm E}(y_t^2)=\phi {\rm E}(y_ty_{t-1})+{\rm E}(\varepsilon_ty_t)=\phi {\rm E}(y_ty_{t-1})+\phi {\rm E}(\varepsilon_ty_{t-1})+{\rm E}(\varepsilon_t^2) \ .$

$\gamma(0)=\phi\gamma(1)+\sigma^2 \ .$

$\gamma(1)=\phi\gamma(0) \ .$

$\gamma(0)=\frac{\sigma^2}{1-\phi^2} \ .$

$\gamma(k)=\phi^k\frac{\sigma^2}{1-\phi^2} \ ,$

$\rho(k)=\phi^k \ .$

$p(k)= \left\{ \begin{array}{lll} \phi &, & k=1\\ 0 &,& k\geq1 \end{array} \right. \ .$

PACF 只是一个连续的总体自回归序列中的最后一期滞后项的自回归系数。如果真实过程实际上是 ${\rm AR}(1)$ ，则 $p(1)$ 就是自回归系数 $\phi$ ，所有较长滞后的系数均为零。

### ${\rm AR}(p)$ 模型

$y_t=\phi_1y_{t-1}+\phi_2y_{t-2}+...+\phi_py_{t-p}+\varepsilon_t \ ,$

$\varepsilon_t\sim{\rm WN}(0,\,\sigma^2) \ .$

$(1-\phi_1\mathscr{B}-\phi_2\mathscr{B}^2-...-\phi_p\mathscr{B}^p)y_t=\varepsilon_t \ .$

$y_t=\frac{1}{\Phi(\mathscr{B})}\varepsilon_t$

## ${\rm ARMA}(p,\,q)$ 模型

### ${\rm ARMA}(1,\,1)$ 模型

$y_t=\phi y_{t-1}+\varepsilon_t+\theta\varepsilon_{t-1} \ ,$

$\varepsilon_t\sim{\rm WN}(0,\,\sigma^2) \ .$

$(1-\phi\mathscr{B})y_t=(1+\theta\mathscr{B})\varepsilon_t \ .$

$|\phi|<1$${\rm ARMA}(1,\,1)$ 序列是平稳的，当 $|\theta|<1$${\rm ARMA}(1,\,1)$ 序列是可逆的。

### ${\rm ARMA}(p,\,q)$ 模型

$y_t=\phi_1y_{t-1}+\phi_2y_{t-2}+...+\phi_py_{t-p}+\varepsilon_t+\theta_1\varepsilon_{t-1}+\theta_2\varepsilon_{t-2}+...+\theta_q\varepsilon_{t-q} \ ,$

$\varepsilon_t\sim{\rm WN}(0,\,\sigma^2) \ .$

$\Phi(\mathscr{B})y_t=\Theta(\mathscr{B})\varepsilon_t \ ,$

$\Phi(z)=1-\phi_1z-...-\phi_pz^p \ ,$

$\Theta(z)=1+\theta_1z+...+\theta_qz^q \ .$

$\Phi(z)$ 的所有根都在单位圆外时，该序列是平稳的：

$y_t=\frac{\Theta(\mathscr{B})}{\Phi(\mathscr{B})}\varepsilon_t$

$\Theta(z)$ 的所有根都在单位圆外时，该序列是可逆的。

$\frac{\Phi(\mathscr{B})}{\Theta(\mathscr{B})}y_t=\varepsilon_t$

## 模型的选择

${\rm AR}(p)$ ${\rm MA}(q)$ ${\rm ARMA}(p,\,q)$
ACF 拖尾 $q$ 步截尾 拖尾
PACF $p$ 步截尾 拖尾 拖尾

${\rm AIC}(k)=\ln\hat\sigma_k^2+\frac{2k}{n} \ ,$

${\rm BIC}(k)=\ln\hat\sigma_k^2+\frac{k\ln n}{n} \ .$

## 弱相依时间序列

$h$ 无限增大时，如果 $y_t$$y_{t+h}$ 是“近乎独立”的，则这个序列被称为弱相依的（weakly dependent）。注意这个概念与时间序列是否平稳无关。

$y_t=\alpha+\beta t+u_t \ ,$

$u_t\sim {\rm i.i.d.}\ {\rm WN}(0,\,\sigma_u^2) \ .$

${\rm E}(y_t)={\rm E}(\alpha+\beta t+u_t)=\alpha+\beta t \ ,$

$\gamma_h={\rm Cov}(y_t,\,y_{t+h})={\rm Cov}(u_t,\,u_{t+h})=0 \ .$

## ${\rm ARIMA}(p,\,d,\,q)$ 模型

step.1 先确定差分次数 $d$ ：对序列进行 ADF 平稳性检验，如果非平稳，则对序列进行差分，并再次进行 ADF 平稳性检验，直到经过 $d$ 次差分后变成平稳序列，此时 $d$ 即为差分阶数。

step.2 确定 $p$$q$ ，对差分后的序列建立 ${\rm ARMA}$ 模型，利用 ACF 和 PACF 图像信息是否截尾和AIC、BIC信息准则确定最佳的参数 $p$$q$

step.3 建模并估计参数，对回归后的残差序列进行白噪声的 $Q$ 检验。

posted @ 2021-02-16 01:02  李旭东东东东东阿东  阅读(107)  评论(0编辑  收藏