时间序列概念
1.EDA探索性数据分析目的是最大化对数据的直觉,完成这个事情的方法只能是结合统计学的图形以各种形式展现出来。通过EDA可以实现:
1)得到数据的直观表现
2) 发现潜在的结构
3) 提取重要的变量
4) 处理异常值
5)检验统计假设
6) 建立初步模型
7)决定最优因子的设置
2.时间序列分析的概念:时间数列也叫动态数列,是指把某种现象在不同时间上的各个变量值按照时间的先后顺序排列而形成的一种数列。
3.时间序列组成的两个要素:时间要素和数据要素。
4.时间序列的作用:深入揭示现象变化的数量特征;反映现象发展变化的趋势和规律;揭示现象变化的内在原因,为预测和决策提供可靠的数量信息。
5.构成时间序列的四个因素:长期趋势(Secular Trends)、季节趋势(Seasonal fluctuation)、循环变动(Cyclical movement)、不规则变动(Irregular fluctuations)。
5.1长期趋势(Secular Trends)
5.1.1研究长期趋势的目的:为了认识和掌握现象发展的规律性,为统计预测提供必要条件;同时,也是为了将其从时间数列中剔除,以便分析其它因素对时间数列的影响。
5.1.2测定长期趋势的方法:移动平均法和最小二乘法(趋势方程法)。
5.2季节趋势(Seasonal fluctuation)
5.2.1研究季节趋势的目的:以月或季为单位的时间数列,测定以年为周期随季节转变而发生的有规律的周期变动。为了消除偶然因素影响,一般应使用多年(至少三年)的历史资料。
5.2.2测定长期趋势的方法:同期平均法和长期趋势剔除法。
5.3循环变动(Cyclical movement)和不规则变动(Irregular fluctuations)
5.3.1循环变动:指一年以上的周期内,时间数列沿着长期趋势直线上下波动变化。
5.3.2循环变动分析如下:
1.首先将原始数据(按月、季、天等)构成的时间数列,调整为以年为单位的时间数列。 因为在影响时间数列的四种因素中,季节变动是一年内的有规律变化,不影响其它年 份,所以使用以年为周期的时间数列消除了季节变动影响,只反映长期趋势、循环变动 和不规则变动的影响。
2.利用趋势方程确定长期趋势T。
3.不规则变动假定为随机变量,在一段时间上的变化总量趋于0。
4.确定循环变动C。
5.3.3不规则变动:从时间数列中剔除长期趋势、循环变动和季节变动后,还有不可预测的不规则变化因素保留下来。不规则变动的原因有时很明显,有时又难以捕捉,所以不规则变动具有不可预见性,不能用确切的公式加以确定。由于不规则变动的随机性,在一段时间内这些随机因素可以互相抵消,这样,在对时间数列的变化因素进行分析时,可以不予考虑。例如上面例子中,以年为单位的时间数列,不规则变动因素可以忽略不计。
6.叠加模型:如果四种变动之间是相互独立的关系,那么应用叠加模型
7.乘积模型:如果四种变动之间存在相互影响关系,那么应该使用乘积模型
注:反映在具体的时间序列图上,如果随着时间的推移,序列的季节波动变得越来越大,则反映各种变动之间的关系发生变化,建议使用乘积模型;反之,如果时间序列图的波动保持恒定,则可以直接使用叠加模型。
网友评论