本文是《商务与经济统计》一书的笔记。
时间序列的模式
水平模式
数据围绕一个不变的均值上下波动
平稳时间序列定义:数据有一个不变的均值;时间序列的变异性随时间推移不变
趋势模式
在一段较长的时间内,发生逐步的改变。按通常理解,就是整体上的一种趋势(过程中依然可能存在波动)。
对于趋势,可以去拟合它,比如线性拟合、曲线拟合
季节模式
由于“季节”影响,时间序列出现重复模式。此处“季节”指的是某种阶段,可以是季度,也可以是月份等。只是地球上季节的效应比较明显
趋势与季节模式
一般情况下,会同时存在趋势和季节模式,比如在出现重复模式的同时也出现趋势上升或下降的情况
循环模式
出现持续一年以上的在趋势线上下交替的点序列,则存在循环模式。通常与长期趋势影响合并,成为趋势循环影响,本章没有涉及到循环模式。
预测精度
这部分略,几个概念:预测误差、平均绝对误差MAE、均方误差MSE、平均绝对百分数误差MAPE
移动平均和指数平滑法
K阶移动平均
使用近K期数据的均值作为预测值:
加权移动平均
即赋予数据不同权重,权重总和为1.
指数平滑法
加权移动平均的一个特例,仅使用一个参数。
如果时间序列波动太大,通常选择更小的平滑参数(即最近值权重低)
趋势推测法
略。这里就是简单的线性、非线性拟合了。
季节性和趋势
对于季节性数据建立方程时,需要采用虚拟变量,举个例子,有分季度的几年数据,设置3个虚拟变量(季度数-1):
则一般季节性方程为:
时间序列分解法
本章精髓。将一个时间序列分解出季节、趋势、不规则成分
加法模型
如果前期季节影响的规模与后期规模相同,则加法模型适合。否则应使用乘法模型。
乘法模型
其中趋势用被预测项目的单位衡量,其他按相对量衡量(数值大于1表示影响在趋势之上)。实践中,通常使用的就是乘法模型。
计算季节指数
原理:我们在预测的时候,一般是需要消除季节影响的(比如冬天棉袄卖的比夏天多,如果我们非要比较夏天和冬天棉袄的销量,则必需剔除季节影响才能比较),为了得到季节指数,需要从乘法模型中剔除趋势和不规则成分。得到季节指数后,我们再从原始数据中剔除季节影响,然后去做趋势拟合(趋势比较需要剔除季节影响),预测出的结果再乘以季节指数(预测是不需要剔除季节影响的)
讲下具体的步骤:
- 调整数据:因为各“季节”所含的天数可能是不一样的,直接比较不好,比如2月28天,3月31天,这样比较就不准确,所以通常做法是月销量除以该月天数,再乘以一年内平均每个月的天数
- 观察数据散点图、折线图,确定该用什么模型(默认可选择乘法模型)
- 计算季节指数:
3.1 计算移动平均数(以季节种类数作为窗口大小)
3.2 计算中心化移动平均数(因为1-4季度的平均数对应的是2.5季度,需要通过中心化消除小数点),得到趋势值
3.3 原始数据除以对应月份的趋势值,得到“季节-不规则值”
3.4 上面得到的值还含有不规则成分,所以对各季节分别求平均值,消除随机影响,此时得到的就是季节指数
3.5 调整季节指数:有时候季节指数总和/季节种类数不等于1,则需要缩放调整 - 得到季节指数后,先对原始数据除以季节指数
- 对消除季节影响的数据做趋势拟合,此时可进行比较性的任务
- 预测:通过趋势方程进行预测,得到的结果再乘以季节指数,还原为真实的预测值
一些附注
为什么不考虑循环成分
因为难。因为循环成分一般是长周期的,要获取足量的数据难,循环的周期长短不一也是难点。
计算季节指数的不同方法
在3.4中使用的是均值,也可以使用中位数等
网友评论