seq2seq

seq2seq

作者: 数据智能谷 | 来源:发表于2019-10-20 07:36 被阅读0次

Seq2Seq模型概述
2016-12-10 今日收集
02-seq2seq原理与实践
2019-01-21 seq2seq代码解析
seq2seq 入门
详解从 Seq2Seq模型、RNN结构、Encoder-Deco
深度模型Attention
NLP（3）——seq to seq
（八）sequence to sequence —3
tf.fill

Seq2Seq模型是RNN最重要的一个变种：N vs M（输入与输出序列长度不同）。

这种结构又叫Encoder-Decoder模型。

原始的N vs N RNN要求序列等长，然而我们遇到的大部分问题序列都是不等长的，如机器翻译中，源语言和目标语言的句子往往并没有相同的长度。

为此，Encoder-Decoder结构先将输入数据编码成一个上下文向量c：

image

得到c有多种方式，最简单的方法就是把Encoder的最后一个隐状态赋值给c，还可以对最后的隐状态做一个变换得到c，也可以对所有的隐状态做变换。

拿到c之后，就用另一个RNN网络对其进行解码，这部分RNN网络被称为Decoder。具体做法就是将c当做之前的初始状态h0输入到Decoder中：

image

还有一种做法是将c当做每一步的输入：

image

由于这种Encoder-Decoder结构不限制输入和输出的序列长度，因此应用的范围非常广泛，比如：

机器翻译。Encoder-Decoder的最经典应用，事实上这一结构就是在机器翻译领域最先提出的

文本摘要。输入是一段文本序列，输出是这段文本序列的摘要序列。

阅读理解。将输入的文章和问题分别编码，再对其进行解码得到问题的答案。

语音识别。输入是语音信号序列，输出是文字序列。

相关文章

Seq2Seq模型概述
seq2seq序列到序列模型本文从RNN角度出发，主要是讲述seq2seq模型的原理。 Seq2Seq模型简介 ...
2016-12-10 今日收集
【(TensorFlow)基于Attention的seq2seq学习】’seq2seq - Attention-b...
02-seq2seq原理与实践
目录原理部分机器翻译发展历史 Seq2Seq网络基本架构 Seq2Seq网络应用 Seq2Seq存在的问题 A...
2019-01-21 seq2seq代码解析
seq2seq代码解析 seq2seq - shichaog的专栏- CSDN博客 LSTM里Embedding ...
seq2seq 入门
本文结构：什么是 seq2seq？ Encoder–Decoder 结构？ seq2seq 结构？什么是 se...
详解从 Seq2Seq模型、RNN结构、Encoder-Deco
一、Seq2Seq 模型 1. 简介 Sequence-to-sequence (seq2seq) 模型，顾名思义...
深度模型Attention
Attention机制源于对Seq2Seq模型的几个问题优化。Seq2Seq是基于Encoder-Decoder架...
NLP（3）——seq to seq
什么是Seq2Seq网络？在Seq2Seq模型中采用了这种 Encoder-Decoder架构，其中 Encode...
（八）sequence to sequence —3
实现beam_search部分基于tensorflow1.4 Seq2seq的实现 1.使用seq2seq库实现...
tf.fill
Example: Case in seq2seq model:

网友评论

本文标题：seq2seq

本文链接：https://www.haomeiwen.com/subject/vjaglctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|seq2seq|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！