深度学习（3）Long short term memory-LS

深度学习（3）Long short term memory-LS

作者: WallE瓦力狗 | 来源:发表于2019-03-16 16:02 被阅读0次

深度学习（3）Long short term memory-LS
Balance
2018-12-06
平衡产品方向的思考
【4】职业规划
long term run or short term run
LSTNet Paper Review
如何理解 RNNs & LSTM 网络及资料
2-7 异常检测 Long short term memory
长短期记忆网络（LSTM）简述

Recurrent Neural Network

相比于一般的神经网络，比如MLP(Full-connection Neural Network),RNN是一种用于处理序列数据的神经网络，它能处理序列变化的数据。比如一个单词在上下文中的会有的不同含义。它能很好地处理这类问题。

RNN简介

Naive RNN

x为当前的输入状态
h为接收的上一节点的输入数据
y为当前节点状态下的输出
h'为传递到下一节点的输出

RNN

LSTM简介

长短期记忆（LSTM）是一种特殊的RNN, 主要是为了解决长序列训练过程中的梯度消失和梯度爆炸的问题。相比普通的RNN，LSTM能够在更长的序列里有更好的表现。

普通RNN和LSTM结构对比

相比RNN只有一个传递状态，LSTM有两个，一个 $c^t$ （cell,state）,一个 $h^t$ (hidden state)。（RNN中的 $h^t$ 对应于LSTM中的 $c^t$ ）

其中对于要传递的 $c^t$ ，状态改变很慢，通常输出的 $c^t$ 是上一个状态传过来的 $c^t-1$ 加上一些数值。而 $h^t$ 则在不同节点下往往会有很大的区别。

深入LSTM的结构

首先，使用LSTM的当前输入 $x^t$ 和上一个状态传递下来的 $h^t-1$ 拼接训练得到四个状态。

四个状态

$z^f$ 、 $z^i$ 、 $z^o$ 都是拼接向量乘以权重矩阵后，通过一个sigmoid激活函数转换成0到1之间的数值，来作为一种门控状态。

而z是将结果通过tanh激活函数转换成0到1之间的数值。

进一步介绍这四个状态在LSTM中的使用

$\odot$ 是Hadamard Product, 也就是操作矩阵中对应的元素相乘，两个相乘矩阵是同型的。 $\oplus$ 则代表着矩阵相加。

LSTM内部主要有三个阶段：

1、忘记阶段，对上一个节点传进来的输入进行选择性忘记。
具体来说，通过计算得到的 $z^f$ （forget），来作为忘记门控，来控制上一个状态 $c^t-1$ 哪些需要留，哪些需要忘记。

2、选择记忆阶段，这个阶段对这个阶段的输入进行选择性记忆。主要是对 $x^t$ 进行选择记忆。哪些重要着重记忆。
当前的输入内容有前面计算得到的z得到。
选择的门控信号是由 $z^i$ （information）来控制。

将上面两步得到的结果相加，即可得到传输给下一个状态的 $c^t$ 也就是上图中的第一个公式。

3、输出阶段。这个阶段将决定哪些会被当成当前状态的输出。主要通过 $z^o$ (output)来控制。

与普通RNN类似，输出 $y^t$ 往往最终也是通过 $h^t$ 变化得到。

相关文章

深度学习（3）Long short term memory-LS
Recurrent Neural Network 相比于一般的神经网络，比如MLP(Full-connection...
Balance
How to balance the benifit of short term and long term? 这...
2018-12-06
short term pain for long term gain. have faith
平衡产品方向的思考
译自《Balancing Short and Long Term Product Thinking》 By Mel...
【4】职业规划
plan 计划 goal 目标 objective 目标 long-term 长期的 short-term 短期的...
long term run or short term run
友情分享假日才有人搭的摩天轮，平日该降价揽客吗？大前研一：这是最常见的错误方法！我在麦肯锡担任经营諮询顾问时，...
LSTNet Paper Review
一、概述 Modeling Long- and Short-Term Temporal Patterns with...
如何理解 RNNs & LSTM 网络及资料
图解LSTM Long_Short_Term_Memory Web Page TensorFlow官方LSTM教程...
2-7 异常检测 Long short term memory
一、基本信息题目：Long short term memory networks for anomaly d...
长短期记忆网络（LSTM）简述
本文是学习LSTMs入门知识的总结。 LSTM（Long-Short Term Memory）是递归神经网络（RN...

网友评论

本文标题：深度学习（3）Long short term memory-LS

本文链接：https://www.haomeiwen.com/subject/gymlmqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|深度学习（3）Long short term memory-LS|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！