GRU

作者: 来到了没有知识的荒原 | 来源:发表于2021-03-23 14:20 被阅读0次

    LSTM结构图:

    三个门控

    三次简化一张图:一招理解LSTM/GRU门控机制

    r_t:reset门。越大,记忆上一次越多;越小,遗忘(forget)越多
    z_t:update门。越大,看的越远(long term memory);越小,看的越近。

    一般来说那些具有短距离依赖的单元reset gate比较活跃,具有长距离依赖的单元update gate比较活跃。
    (如果r_t为1,而z_t为0 那么相当于变成了一个标准的RNN,能处理短距离依赖)

    我的理解,为什么GRU比LSTM少了一个门:
    定性来看,GRU比LSTM少的应该是output gate
    GRU的reset gate对应LSTM的forget gate,表示保留多少long-term memory
    GRU的update gate对应LSTM的input gate,表示新进来的信息x_t的重要性

    但是数学上来看相似度不是太大。只是定性地感觉。。

    相关文章

      网友评论

          本文标题:GRU

          本文链接:https://www.haomeiwen.com/subject/wjdfhltx.html