RNN LSTM语言模型 ——RNN

RNN LSTM语言模型 ——RNN

作者: jenye_ | 来源:发表于2022-07-22 17:05 被阅读0次

RNN LSTM语言模型 ——RNN
02-25：RNN算法
自然语言模型评估
深度学习——RNN(2)
序列模型简介——RNN, Bidirectional RNN,
循环神经网络内部
[tensorflow](六) RNN
「深度学习」循环神经网络 RNN 学习笔记
RNN，LSTM，GRU
用RNN进行mnist分类

RNN的结构

RNN的缺点

ref:https://blog.csdn.net/jizhidexiaoming/article/details/81743584

梯度消失
梯度爆炸

梯度消失：一句话，RNN梯度消失是因为激活函数tanh函数的倒数在0到1之间，反向传播时更新前面时刻的参数时，当参数W初始化为小于1的数，则多个(tanh函数’ * W)相乘，将导致求得的偏导极小（小于1的数连乘），从而导致梯度消失。

梯度爆炸：当参数初始化为足够大，使得tanh函数的倒数乘以W大于1，则将导致偏导极大（大于1的数连乘），从而导致梯度爆炸。

RNN的不同结构

one to one：常常用在图像分类，没有循环结构比较简单

one to many：常常用在图片描述，输入一张图片输出一堆文字

many to one：常常用在文本的情感分析，（yej：时序预测也可以）。
第四个和第五个有什么区别？
many to many：一般做机器翻译，输入和输出不同（Seq2Seq）。

many to many：输入和输出的个数是一样的，往往做视频分类。

考虑上下文
精度更高，但是计算量更多。

LSTM

缓解RNN的梯度消失和梯度爆炸

相关文章

RNN LSTM语言模型 ——RNN
RNN的结构 RNN的缺点 ref:https://blog.csdn.net/jizhidexiaoming/a...
02-25：RNN算法
RNN算法 1、RNN算法原理（1）RNN变种GRU (2)RNN变种LSTM LSTM缺点分析： todo: ...
自然语言模型评估
模型分类 RNN RCNN lstm GRU bilstm lstm-crf attention fasttext...
深度学习——RNN(2)
前言：前面介绍了LSTM，下面介绍LSTM的几种变种双向RNN Bidirectional RNN(双向RNN)...
序列模型简介——RNN, Bidirectional RNN,
摘要：序列模型大集合——RNN, Bidirectional RNN, LSTM, GRU 既然我们已经有了前馈...
循环神经网络内部
LSTM RNN
[tensorflow](六) RNN
20181204 qzd 1 RNN简介 2 LSTM 3 RNN的变种 4 RNN样例应用
「深度学习」循环神经网络 RNN 学习笔记
循环神经网络 RNN 演化流程： RNN -> BRNN -> GRU -> LSTM RNN 「循环神经网络」 ...
RNN，LSTM，GRU
RNN LSTM GRU
用RNN进行mnist分类
RNN与LSTM RNN网络是在传统神经网络的基础上加入了记忆的成分。对于RNN模型来说，序列被看做一系列随着时间...

网友评论

本文标题：RNN LSTM语言模型 ——RNN

本文链接：https://www.haomeiwen.com/subject/jadpbrtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|RNN LSTM语言模型 ——RNN|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！