数据平稳性和差分法
平稳性:
- 平稳性就是要求经由样本时间序列所得到的拟合曲线。在未来的一段期间内仍能顺着现有的形态“惯性”地延续下去。
- 平稳性要求序列的均值和方差不发生明显变化。
严平稳与弱平稳:
严平稳:严平稳表示的分布不随时间的改变而改变。如:白噪声(正态),无论怎们取,都是期望为0,方差为1.
弱平稳:期望与相关系数不变。未来某时刻的t的值Xt就是依赖于它的过去信息,所以需要依赖性。
差分法:时间序列在t与t-1时刻的差值。(对数据进行差分,可以使数据满足平稳性).diff(1)
ARIMA模型
自回归模型(AR)
- 描述当前值与历史值之间的关系,用变量自身的历史数据对自身进行预测
- 自回归模型必须满足平稳性的要求。
- 数据必须具有自相关性,如果自相关系数小于0.5,则不宜采用。
- 自回归只适用于预测与自身前期相关的现象。
移动平均模型(MA)
- 移动平均模型关注的是自回归模型中误差项的累加。
- 移动平均能有效的消除预测中的随机波动。
自回归移动平均模型(ARMA)
自回归与移动平均的结合
差分自回归移动平均
ARIMA(p,d,q)
p为移动平均项数,d为时间序列成为平稳时所做的差分次数,q为移动平均项数。
原理:将非平稳时间序列转化为平稳时间序列然后将因变量仅对它的滞后量以及随机误差项的现值和滞后值进行回归所建立的模型。
相关函数评估方法
自相关系数ACF(autocorrelation function)
- 有序的随机变量序列与其自身相比较
自相关函数反映了同一序列在不同时序的取值之间的相关性。 自回归系数的取值范围[-1,1]
偏自相关函数(PACF)
ACF包含了其他变量的影响,而偏自相关系数PACF是严格的两个变量之间的相关性。
建立ARIMA模型及参数选择
将数据平稳化,确定d
通过ACF与PACF来确定p值和q值
视频地址:时间序列ARIMA模型
网友评论