美文网首页深度学习
2020 时序分析(10)

2020 时序分析(10)

作者: zidea | 来源:发表于2020-06-17 21:07 被阅读0次
machine_learning.jpg

今天我们主要说时间序列的一些推导公式,之前看些资料,其中关于时间序列中常用AR模型、MA模型背后推导说的比较深,不易于理解。最近看了一些资料,适当地总结一些。

时间序列

时间序列虽然简单、但是要是想真正弄懂也需要花费一些功夫,将序列分解为一下形式。
X_t = T_t + S_t + R_t, t =1,2,\dots

  • T_t 趋势项
  • S_t 季节项
  • R_t 随机性

这通过加法模型将这些项来表示时间序列,其中趋势项和季节项我们是可以通过模型来拟合,因为他们都是有规律可循的,需要我们能够通过模型学出来

\begin{aligned} GDP_t = GDP_{t-1}(1 + 0.07)^1\\ GDP_t = GDP_{t-2}(1 + 0.07)^2 \end{aligned}
GPD 就是一个趋势模型,而且是随着时间而不断成指数增长。

超市的人流,具有周期性,每周的人流在周末人流要相对于周一到周五人要多一些。每天人流下午要相对于上午人流要多一些。

X_t - T_t - S_t = R_t, t =1,2,\dots
那么也就是说明我们对 R_t ,我们之前讨论过时间序列是一个随机过程,也就是f(x_1,x_2,\dots,x_t) 的联合分布,通常我们研究一个联合分布是一个比较复制的问题。
这是我们在统计模型时候,最早的NPL 分析用到链式法则来表示联合概率一种
p(x_1)p(x_2|x_1)p(x_3|x_1,x_2)\dots p(x_n|x_{n -1},x_{n-2},\dots,x_1)
学习过概都知道条件概率,时序每一个时刻随机变量都是和他之前的随机时间点的概率是相关。这就是联合概率,要计算这个联合概率是需要相当大的计算量。

  • 马氏过程 p(x_3|x_2,x_1) = p(x_3|x_2)
    p(x_1)p(x_2|x_1)p(x_3|x_2)\dots p(x_n|x_{n-1})
    也就是把影响缩小到某一个时刻随机变量概率仅与其前一时刻的概率分布相关,这就可以表达为马氏过程

  • 还有一种方式也就是今天我们讨论的表现形式。
    x_n = f(x_{n-1},\dots,x_1,\epsilon_n,\dots,\epsilon_0)
    认为这个函数是之前 p 个时间点的线性组合,然后在
    a_1x_{n-1} + \dots + a_px_{n-p} + \epsilon_n
    这就是在时间序列要研究的模型为 AR(p) 模型,\epsilon_n是白噪声像,也是随机扰动项,类似小球落地弹起的过程,我们知道小球落地后会弹起一定高度,小球每次弹起高度都可以看成系数,随着弹起次数增加,小球高度逐渐减少、这里\epsilon_n表示干扰项,也就是外力的作用改变衰减过程。

x_t = 0.8x_{t-1} + \epsilon_t

x_t = ax_{t-1} + \epsilon_t
当 a 小于 1 说明模型是稳定,反之说明模型是不稳定,为什么会有这样结论。我们可以结合小球的落地原理来项这个问题。
其实我们非齐次项差分方程
x_t - 0.8x_{t-1} = \epsilon_t
下面是差分方程通解
x_t - 0.8x_{t-1} = 0
Bx_t = x_{t-1}
其中 B 也即是滞后算子L,这里用 B 来表示,这里还是再演示一下吧
\begin{aligned} x_{t-1} = Bx_t \\ x_{t-2} = B^2x_t \\ \end{aligned}
x_t - 0.8Bx_t = \epsilon_t
接下来计算特征解,提取左边x_t
(I - 0.8B)x_t = \epsilon_t
x_t = (I - 0.8B)^{-1}\epsilon_t

\frac{1}{1 - 0.8Z}
\frac{1}{1-x} = \sum_{n=0}^{\infty} x^n = 1 + x+ x^2 + \dots x^n + ,|x|<1
可以表示无限变量只和形式,这个大家应该不会陌生,而且\frac{1}{1 + x} 类似\frac{1}{1 - 0.8Z},所以替换替换等比数列之和。
\begin{aligned} \frac{1}{1 - 0.8z} = \sum_{n=0}^{\infty}(0.8z)^n\\ (I - 0.8B)^{-1} = \sum_{n=0}^{\infty}(0.8B)^n \end{aligned}

x_t = \sum_{n=0}^{\infty}(0.8)^nB^n \epsilon_t = \sum_{n=0}^{\infty} 0.8 \epsilon_{t-n}

B^n\epsilon_t = (B,B\dots,B)\epsilon_t

重点相关性研究x_tx_{t-k}可以用a_1,\dots,a_p计算出来。AR序列相关性是随着负指数衰减,MA(q) 模型是有限相关性,
X_t = b_1 \epsilon_{t-1} + \dots + b \epsilon_{t-q} 有限时间序列相关(X_t,X_{t-q-1})=0

根据均方差最小原则,来进行预测
f(x_{t-1},\dots,x_{t-p}) = E(x_t|x_t\dots x_{t-p})
也就是我们讨论的AR模型,那么AR模型就可以用于时间序列分析
a_1x_{t-1} + \dots + a_p x_{t-p}

f(x_1,x_6,x_7) = f(x_2,x_7,x_8) 这样时间序列步长间隔相同间分布是一致,这样时间序列才是平稳的时间序列。线性filter

f(x) = \sum_{n=0}^{\infty} a_n \sin nx + \sum_{n=1}^{\infty} b_n \cos nx
这是研究时间序列另一种模型,通过频域来研究时间序列

x_t = a_1 x_{t-1} + \dots + a_p x_{t-p} + \epsilon_t

  • a_1,\dots,a_p 不能随意取值,a_1z_p + \dots + a_pz =0 的多项式根必须在单位圆外部
  • 对于AR模型有a_1,\dots,a_p 和研究Var(\epsilon_t) = \sigma^2 有 p+1 个参数,我们主要就是研究这个写参数,通过调整参数找到拟合预测线最好

相关文章

  • 2020 时序分析(10)

    今天我们主要说时间序列的一些推导公式,之前看些资料,其中关于时间序列中常用AR模型、MA模型背后推导说的比较深,不...

  • STA【1】

    一、 STA 时序分析分为动态时序分析(DTA, Dynamic Timing Analysis)和静态时序分析(...

  • 2020 时序分析(17)

    平稳的时间序列 所谓平稳性时间序列,虽然每一 t 时刻随机变量都是独立,但是他们具有相似性,都服从相似的分布,所以...

  • 2020 时序分析(16)

    时间序列分析 时间序列的定义 按时间排序的一组随机数变量,可以用数学语言表示如下 上面小写 x 表示在从下面大 X...

  • 2020 时序分析(12)

    平稳时间序列 我们研究时间序列的概率特征是随时间变化而变化,对概率性质,的概率这些服从同一个概率分布,独立重复观察...

  • 2020 时序分析随笔

    多元时间序列分析 通过分析序列自身的变化规律,构建时间序列模型 一元时间序列分析方法 多元时间序列分析 在 198...

  • 2020 时序分析(7)

    平稳性 时间序列分析理论中有两种平稳性定义 严平稳(strictly stationary) 弱平稳(weakly...

  • 2020 时序分析(15)

    最近在做时序预测,时序预测的模型可能相对于图像识别这边模型要简单的多,而且更多会使用到数据统计模型和分析工具,用到...

  • 2020 时序分析(3)

    参考 Python For Finance 第二版 在财务做衍生商品一般会遇到的问题,其实在实际中需要商品都是导...

  • 2020 时序分析(9)

    时间序列平稳性与非平稳性 在计量经济学中,主要研究范畴就是平稳时间序列。而在现实经济金融活动中,很大部分时间序列都...

网友评论

    本文标题:2020 时序分析(10)

    本文链接:https://www.haomeiwen.com/subject/jjdexktx.html