美文网首页
RNN Recurrent Neural Network

RNN Recurrent Neural Network

作者: oword | 来源:发表于2021-04-26 16:48 被阅读0次

coursera deeplearning
RNN 模型


image.png image.png

激活函数一般是tanh , 化简后的公式为


image.png

损失函数


image.png

y : 标签值
ŷ: 实际值
t : 时间戳
Ty : 句子的长度

RNN 的不同形式


image.png

one to many : 经常用来音乐生成和句子生成

image.png

many to one : 可以用来判断语句的情绪是好的还是坏的

image.png

many to many : 可以用来实现命名实体识别 name entity recognition

image.png

many to many : 可以实现自动翻译

Sampling Novel Sequences 对新序列采样


2.PNG

采样根据当前词计算出每一个词在下一个位置的概率,根据概率分布进行随机采样,当前词的输出是下一个词的输入,一般使用字级模型,不用字符级模型,字符级模型计算量大,比较复杂

Vanishing Gradients with RNNs 在RNN中的梯度弥散
gradient clipping : 当梯度大于某个阈值,出现梯度爆炸时,将其缩小
Vanishing Gradients : 当单词比较多时,相当于RNN的结构很长,容易出现梯度弥散,因此,某一个较早时间戳的词对较晚时间戳的词影响很小,不擅长捕获远程依赖关系

相关文章

网友评论

      本文标题:RNN Recurrent Neural Network

      本文链接:https://www.haomeiwen.com/subject/ujuerltx.html