1 平稳性:
解释:平稳性就是要求由样本时间序列所拟合得到的曲线,在未来一段时间仍顺着现有的形态惯性
地延续下去。
体现:平稳性要求序列的统计指标(均值、方差)不发生明显
变化
严平稳:严平稳表示数据分布不随时间的改变而改变(如正态分布)
弱平稳:期望与相关系数(依赖性)不变
一个弱平稳过程不一定是严平稳过程,一个严平稳过程也不一定宽平稳过程。
2 差分法
时间序列在不同时刻的差值(t, t-1时刻的差),差分法可以使数据变得平稳,相当于求导操作。
3 AR自回归模型
- 描述当前值与历史值之间的关系,用变量自身的历史数据预测未来
- 自回归必须满足平稳性要求
- p阶AR过程定义:
是自相关系数,
是误差项
自回归模型的限制:
- 只能用自身的数据来预测与自身前期数据相关的现象
- 必须平稳
- 必须自相关,如果自相关系数小于
0.5
,则不建议采用
4 MA 移动平均模型
- MA 关注的是自回归模型中误差项的累加
- q阶自回归过程的定义:
- 移动平均法能够有效消除预测中的随机波动
5 ARMA 自回归移动平均
定义:
求解参数:,
6 ARIMA(p, d, q) 差分自回归移动平均模型
- p 自回归项
- q 移动平均项
- d 差分阶数
- 原理:将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值、以及随机误差项的现值和滞后值进行回归所建立的模型。
7 自相关函数ACF(Autocorrelation function)
- 有序的随机变量序列与自身作比较
自相关函数反映了同一序列在不同时序的取值之间的相关性 - 公式:
的值域为
8 偏自相关函数(PACF)
- 对于一个平稳AP(p)模型,求之后k自相关系数p(k)时,实际上得到的并不是x(t)与x(t-k)之间单纯的相关关系,中间还掺杂了x(t-1),x(t-2)...的影响,而这k-1个随机变量又都和x(t-k)有相关关系,所以自相关系数
掺杂了其他变量的影响
- 剔除了中间k-1个随机变量的干扰后,得到的相关系数是PACF,是严格的两个变量之间的相关性.
python 库 statsmodel
9 ARIMA建模流程
- 将序列平稳(差分法确定d)
- p,q阶数确定:ACF与PACF
- 建模ARIMA(p, d, q)
网友评论