ARIMA模型

作者: 拯救大圈仔 | 来源:发表于2019-02-19 11:27 被阅读0次

arima 时间序列分析
时间序列预测--ARIMA模型
Arima实战：利用Python中pyramid-arima库进
10实现金融数据的时间序列分析及建模
用ARIMA模型做需求预测
ARIMA模型
ARIMA模型
statsmodels.tsa.arima_model out
ARIMA时间序列模型
机器学习(十一)：时间序列AIRMA模型及案例分析

1. 白噪声 White Noise

如果一个时间序列是纯随机的，那么它就是白噪声。

可以用 $\varepsilon_{t}$ 来表示这种时间序列，它的平均值是0 $[E(\varepsilon _{t} )=0]$ ，方差是常数 $[V(\varepsilon _{t} )=\sigma ^2]$ ，并且是一个不相关的随机变量 $[E(\varepsilon _{t}\varepsilon _{s})=0]$ 。

这种序列的散点图表明不了任何模式，所以不可能预测这种序列未来的值。

2. 自回归模型 AutoRegressive Model (AR)

AR模型中 $Y_t$ 只跟它过去的值 $Y_{t-1},Y_{t-2},Y_{t-3}$ 等等有关：

$Y_{t}=f(Y_{t-1},Y_{t-2},Y_{t-3},...,\varepsilon _t)$

通常来说，和它 $p$ 个过去的值有关的AR模型叫做AR(p)模型，像这样表示：

$Y_{t}=\beta _{0}+\beta _{1}Y_{t-1}+\beta _{2}Y_{t-2}+\beta _{3}Y_{t-3}+...+\beta _pY_{t-p}+\varepsilon _t$

比如AR(0)就是 $Y_t=\beta _0+\varepsilon _t$ ，AR(1)就是 $Y_t=\beta_0+\beta_1Y_{t-1}+\varepsilon _t$ 。

3. 移动平均模型 Moving Average Model (MA)

移动平均模型中 $Y_t$ 只跟随机误差项有关：

$Y_t=f(\varepsilon _t,\varepsilon_{t-1},\varepsilon_{t-2},\varepsilon_{t-3},...)$

通常来说，和它 $q$ 个过去的值有关的MA模型叫做MA(q)模型，像这样表示：

$Y_t=\beta_0+\varepsilon_t+\phi _1\varepsilon_{t-1}+\phi_2\varepsilon_{t-2}+\phi_3\varepsilon_{t-3}+...+\phi_q\varepsilon_{t-q}$

比如MA(0)就是 $Y_{t}=\beta_0+\varepsilon_t$ ，MA(1)就是 $Y_t=\beta_0+\varepsilon_t+\phi_1\varepsilon_{t-1}$ 。

误差项 $\varepsilon _t$ 就是平均值为0，方差是常数 $\sigma ^2$ 的白噪声。

4. 自回归移动平均模型 AutoRegressive Moving Average Model (ARMA)

这种模型是将AR和MA结合成ARMA(p,q)模型。

ARMA模型与 $p$ 个自己的过去的值和 $q$ 个过去的白噪声值有关：

$Y_t=\beta_0+\beta_1Y_{t-1}+\beta_2Y_{t-2}+\beta_3Y_{t-3}+...+\beta_pY_{t-p}+\varepsilon_t+\phi_1\varepsilon_{t-1}+\phi_2\varepsilon_{t-2}+\phi_3\varepsilon_{t-3}+...+\phi_q\varepsilon_{t-q}$

时间序列的平稳性

严平稳 strictly stationary

如果 $Y$ 在时间 $t$ 的边际分布 $p(Y_t)$ 在任意其他时间点都是相同的话，那么 $p(Y_t)=p(Y_{t+k})$ ，并且 $p(Y_t,Y_{t+k})$ 与 $t$ 无关，（这里 $t\geq 1$ 并且 $k$ 为任意整数），这样的时间序列被称为严平稳。这意味着 $Y_t$ 的平均值、方差和协方差都是时不变的 (time invariant)。

弱平稳 weakly stationary

时间序列被称为弱平稳或者协方差平稳如果满足以下条件：

a) $E(Y_1)=E(Y_2)=E(Y_3)=...=E(Y_t)=\mu (常数)$

b) $Var(Y_1)=Var(Y_2)=Var(Y_3)=...=Var(Y_t)=\gamma _0(常数)$

c) $Cov(Y_1,Y_{1+k})=Cov(Y_2,Y_{2+K})=Cov(Y_3,Y_{3+k})=\gamma _k(和延迟k有关)$

5. 自回归整合移动平均模型 AutoRegressive Integrated Moving Average Model (ARIMA)

经过差分后，一个非平稳的时间序列可以变为平稳的时间序列。

一个经过一次差分后变为平稳的时间序列被称为整合了一次，表示为 $I(1)$ 。

一般而言，被经过d次差分后变为平稳的时间序列被称为整合了d次，表示为 $I(d)$ 。

所以，一个没有被经过差分就已经是平稳的时间序列表示为 $I(0)$ 。

博克斯-詹金斯法 Box-Jenkins (B-J) methodology

对于单变量的时间序列模型的估计和预测可以使用博克斯-詹金斯法，主要分为三步：

(1) 识别 (2) 估计 (3) 诊断检测

B-J法只适用于平稳的变量，所以先要转换成平稳的时间序列。

1. 识别 identification

a) 自相关函数 Autocorrelation function (ACF)

自相关就是在一个时间序列中，观测点之间互相有关联。现在的观测点 $Y_t$ 和 $p$ 个延迟lag之前的观测点 $Y_{t-p}$ 有一个简单的相关性：

$\rho _k=Corr(Y_t,Y_{t-p})=\frac{Cov(Y_t,Y_{t-p})}{\sqrt{var(Y_t)}\sqrt{var(Y_t-p)} }=\frac{\gamma _p}{\gamma _0}$

b) 偏自相关函数 Partial Autocorrelation function (PACF)

偏自相关用于测量当 $Y_t$ 和 $Y_{t-p}$ 之间其他的时间延迟1, 2, 3, ..., (p-1)的影响都被去除后的相关性。

c) 从ACF和PACF推断

理论上的ACF和PACF可以从不同的p和q得出，所以，比较不同pq下ACF和理论值，可以得出合适的ARIMA(p,q)模型。

理论上的ACF和PACF的性质如下表：

模型 | ACF | PACF

AR(p) | 突刺后衰减趋于0 | 突刺后截止为0

MA(q) | 突刺后截止为0 | 突刺后衰减趋于0

ARMA(p,q) | 突刺后衰减趋于0 | 突刺后衰减趋于0

2. 估计 estimation

主要借助于各种包进行估算得出p,q值

3. 诊断检测 diagnostic checking

a) 最小的AIC/BIC/SBIC值，这些值为最小的模型最好

b) 残差ACF图

如果残差的大部分自相关系数在 $-1.96/\sqrt{N}$ 和 $+1.96/\sqrt{N}$ 之间，N为观测点的数量，这样就可以得出残差是白噪声，也就是说模型是合适的。

arima 时间序列分析
1.arima模型 ARIMA模型的全称叫做自回归移动平均模型，全称是(ARIMA, Autoregressive...
时间序列预测--ARIMA模型
什么是 ARIMA模型 ARIMA模型的全称叫做自回归移动平均模型，全称是(ARIMA, Autoregressi...
Arima实战：利用Python中pyramid-arima库进
Arima 模型的重要假设 ARMA, ARIMA, SARIMA assumptions:▪ Time-seri...
10实现金融数据的时间序列分析及建模
ARIMA模型自回归移动平均模型（ARIMA）包含一个确定（explicit）的统计模型用于处理时间序列的不规则...
用ARIMA模型做需求预测
本文结构：时间序列分析？什么是ARIMA？ ARIMA数学模型？ input，output 是什么？怎么用？...
ARIMA模型
我看过的对ARMIA模型最简单明了的文章：https://www.cnblogs.com/bradleon/p/6...
ARIMA模型
1. 白噪声 White Noise 如果一个时间序列是纯随机的，那么它就是白噪声。可以用来表示这种时间序列，它...
statsmodels.tsa.arima_model out
还是先来吐槽时间序列模型arima 用python 实现的话是用statsmodels.tsa.arima_m...
ARIMA时间序列模型
1 概念 ARIMA模型，全称为自回归积分滑动平均模型（Autoregressive Integrated ...
机器学习(十一)：时间序列AIRMA模型及案例分析
一、简介 ARIMA模型(Autoregressive Integrated Moving Average mod...