美文网首页
循环神经网络模型,seq2seq模型理解

循环神经网络模型,seq2seq模型理解

作者: 平常心_85d9 | 来源:发表于2020-02-18 19:55 被阅读0次

    循环神经网络与一般神经网络的区别:

    1、样本数据区别

          循环神经网络的训练数据的基本单位是num_steps,num_steps个样本作为一组,num_steps个样本有先后顺序。

          数据的shape: batch_size,num_step,num_features

         训练数据的生成方式有:随机采样和相邻采样

    2、网络结构的区别

    在一个num_steps为一组的数据中,上一个样本的输出(历史信息),作为下一输入的一部分。

    第一个的输入是历史信息是state,人工初始化

    RNN与LSTM的区别:

    RNN之将上一个输出(H)作为下一个样本的输入信息,一个训练单元有两个输入Xt和Ht-1

    LSTM在RNN的基础上增加了state变量(C),一个训练单元有三个输入Xt,Ct-1,Ht-1

    RNN图示:

    LSTM图示:

    seq2seq模型理解:

    seq2seq是encoder-decoder结构的实例

    encoder的作用是从输入序列提取出context信息,也就是lstm网络的最后一个state(h,c)

    decoder的作用是以encoder得到的context信息作为initial-state,以<start>作为X1,预测序列,直到输出<end>

    相关文章

      网友评论

          本文标题:循环神经网络模型,seq2seq模型理解

          本文链接:https://www.haomeiwen.com/subject/jqimfhtx.html