LSTM
使用一个特殊的存储记忆单元可以改善RNN
的梯度消失问题,因此在许多自然语言处理任务中它比RNN
有更好的性能。LSTM
单元的基本结构如下图所示。
它由输入门,忘记门,输出门,以及一个记忆单元组成。
给定一个文本序列 表示当前时间步的输入,表示上一步LSTM
的输出。
LSTM
通过门更新记忆单元状态,添加或删除信息以保留与任务相关的内容。 乘以候选值决定了添加到记忆单元的新的输入信息。 乘以 决定从记忆单元状态中移除的已有信息。输出门决定从记忆单元状态最终的输出信息。
输入门:
忘记门:
输出门:
记忆单元候选值:
记忆单元状态更新:
输出:
网友评论