美文网首页
长短记忆神经网络

长短记忆神经网络

作者: JLGao的简书 | 来源:发表于2020-04-30 18:46 被阅读0次
    长短记忆神经网络定义

    长短记忆神经网络(Long-short term memory, LSTM)是一种特殊的RNN结构。该神经网络可以有效保留历史信息,实现对文本的长期依赖信息进行学习。

    关键问题:控制长期状态信息
    图1. 长期状态信息 C 的控制
    解决方法:门控开关

    门的定义:使用门(Gate)实现对图1中开关的控制。所谓的门,即全连接层的一个神经元,如图2所示。门的激活有两种形式:sigmodtanh

    图2. sigmod或tanh激活单元

    门控实现:LSTM网络由输入门(input \ gate)、遗忘门(forget \ gate)、输出门(output \ gate)和一个记忆单元(cell)来实现历史信息的更新和保留,如图3所示。

    图3. LSTM记忆单元
    • 门限开关控制
      遗忘门f_t:决定保留多少上一时刻单元状态信息c_{t - 1}到当前时刻的记忆单元c_{t}中。
      {f_t} = sigmoid\left( {{W_f} \cdot \left[ {{a_{t - 1}},{x_t}} \right] + {b_f}} \right).
      输入门i_t:决定保留多少当前时刻的输入信息x_t到当前时刻的记忆单元c_{t}中。
      {i_t} = sigmoid\left( {{W_i} \cdot \left[ {{a_{t - 1}},{x_t}} \right] + {b_i}} \right).
      输出门{o_{t}}:决定控制多少当前时刻的记忆单元c_{t}的输出值{o_t}
      {o_t} = sigmoid\left( {{W_o} \cdot \left[ {{a_{t - 1}},{x_t}} \right] + {b_o}} \right).

    • 状态更新
      当前时刻cell候选状态值{c_{in}}(中间状态):
      {c_{in}} = \tanh \left( {{W_c} \cdot \left[ {{a_{t - 1}},{x_t}} \right] + {b_c}} \right).
      当前时刻长期状态值{c_t}更新:
      {c_t} = {f_t} \cdot {c_{t-1}} + {i_t} \cdot {c_{in}}.

    • 当前时刻输出值
      当前时刻LSTM单元的输出值{a_{t}}
      {a_t} = {o_t} \cdot \tanh \left( {{c_t}} \right).

    相关文章

      网友评论

          本文标题:长短记忆神经网络

          本文链接:https://www.haomeiwen.com/subject/fftgwhtx.html