自编码器处理时间序列

作者: 升不上三段的大鱼 | 来源:发表于2019-12-10 06:19 被阅读0次

自编码器处理时间序列
Transformer 变形金刚
编码器-解码器(seq2seq)和注意力机制
Python玩转金融时间序列之ARCH与GARCH模型
金融时间序列处理
python 时间序列处理
机器学习算法 - 时间序列系1 -时序模式概念
transformer再记（解码器）
时间序列 1 时间序列的预处理
10实现金融数据的时间序列分析及建模

1. Autoencoder简介

Autoencoder（AE）是一种无监督学习方法，算是一种特殊的feed-forward neural network，基本结构分为三层：input layer $x$ , hidden layer $y$ , output layer $\hat{x}$ ，一般hidden layer的维度比输入层小，输入和输出维度相同。

Input 到 hidden被称为Encoder, $y= f(x)$ ，hidden到 output为 Decoder, $\hat{x} =g(y)$ ，训练目的是让 $\hat{x} =x$

损失函数loss function

$L(x,\hat{x} ) \propto -\log p(x|\hat{x})$

假设 $p(X|\hat{x})$ 为高斯分布， $L(x, \hat{x}) = ||x-\hat{x}||_2^2$

假设 $p(X|\hat{x})$ 为伯努利分布， $L(x,\hat{x}) = -\sum_{i=1}^bn x_{i}\log(\hat{x}_{i}) + (1-x_{i})\log(1-\hat{x}_{i})$

在从input到hidden过程中，由于维度减少，信息被压缩了，因此可以用于减少噪音和降维。AE如果使用线性层和L2 norm作为loss，就相当于一个PCA；AE如果用非线性层就相当于非线性的PCA。

Sparse Autoencoder

与上面的Autoencoder不一样的是，sparse autoencoder的hidden unit （可能会）比 input 多，增加了稀疏性的约束： $L_{SAE}(x, \hat{x},w) = L(x, \hat{x},w) + \Omega (y)$

$y:$ 瓶颈层的activation

$\Omega ：$ 对于 $y$ 的稀疏性约束， L1/L2 norm 或者通过KL-divergence定义

Denoising Autoencoder（DAE）

在训练深度神经网络时，可以用无监督学习的方法做initialization。假设经过DAE处理后的信息都能够很好的保留原来输入的结构特征，并且很稳定，DAE需要做到的是对于一个部分损坏了的输入，重建一个完整的输入信号。

DAE首先在 $x$ 上随机选择一些成分并置为0，得到 $\tilde{x}$ ~ $q_{D}(x| \tilde{x})$ , $\tilde{x}$ 经过映射得到 $y$ , $y$ 重建之后的到 $z$ ，即重建得到“完整信号”。Loss是 $x$ 和 $z$ 的函数。与dropout很类似，不过是在input上。

一个经过x经过处理之后，被f映射到y，然后g重建得到z,loss为x与z的差别[1]

Stacked Autoencoder

多层AE，第一个AE的hidden layer作为第二个AE的input。

Variantional Auoencoder

2. 应用

Autoencoder作为一种无监督学习，可以用于数据的降温，可视化和去噪。对于training中出现过的数据，AE的loss可能会很小，但是对于training数据中没有出现过的数据，loss就会变得很大，由此可以想到，可以利用AE经行异常数据的监测，例如机器设备上传感器信号的异常等，异常数据一般不会经常出现或者完全不会在已有的历史纪录中出现。

Recurrent Autoencoder

RNN和AE结合在一起可以用来对多维时间信号进行重建或者降维，encoder和decoder都是RNN。在时间序列上每一个时间 $t$ 对应的数据作为RNN在时间 $t$ 时的输入，得到一个有H维内容变量 $c$ 。根据RNN的结构可以知道，这个内容变量 $c$ 是基于每个时间 $t$ 的输入和之前 $t-1$ 的隐藏状态得到的。

同样的decoder也是一个RNN 的结构，将内容变量 $c$ 作为输入，得到每个时间 $t$ 对应的输出，输出维度 $K$ 可以小与等于输入维度 $P$ 。当 $K<P$ 时，encoder将会更多的关注与选择的输出维度相关的变量。

对于得到的输出，可以用K-mean的方法聚类，实现无监督的分类，也可以用于异常信号的检测。

Recurrent autoencoder model[2]

Reference

[1] Vincent et., Extracting and Composing Robust Features with Denoising Autoencoders,2008

[2] Recurrent Auto-Encoder Model for Multidimentional Time Series Rresentation, 2018

自编码器处理时间序列
1. Autoencoder简介 Autoencoder（AE）是一种无监督学习方法，算是一种特殊的feed-fo...
Transformer 变形金刚
(一)Transformer 变形金刚 Transformer是基于编码器-解码器架构来处理序列问题的一个网络架构...
编码器-解码器(seq2seq)和注意力机制
编码器-解码器(seq2seq) 编码器(encoder)和解码器(decoder)分别对应着输入序列和输出序列的...
Python玩转金融时间序列之ARCH与GARCH模型
01 引言作为金融时间序列的专题推文，【手把手教你】时间序列之日期处理主要介绍了使用Python处理时间序列的日...
金融时间序列处理
太忙，好久不写笔记了。这两天有空，把该整理的好好整理一下。一、datetime库 2017-06-07 23:1...
python 时间序列处理
数据说明：’./data/raw/pm25.csv’文件为某地2017年一段时间内的PM2.5的每小时监测数据，数...
机器学习算法 - 时间序列系1 -时序模式概念
1 时间序列算法 2 时间序列的预处理首先要对观察值序列做纯随机性和平稳性进行校验，称为序列的预处理。对于纯随...
transformer再记（解码器）
上一篇：transformer再记（编码器）解码器与编码器在细节上有差异。编码器与解码器的连接：编码器通过处理输...
时间序列 1 时间序列的预处理
1 概率分布意义对于时间序列{},它的概率分布如下定义：任取正整数m，任取, 则m维随机向量的联合概率分布定义...
10实现金融数据的时间序列分析及建模
ARIMA模型自回归移动平均模型（ARIMA）包含一个确定（explicit）的统计模型用于处理时间序列的不规则...