看图说话素材与encode-decoder NIC(Neural

作者: 数据智能谷 | 来源:发表于2019-10-20 07:36 被阅读0次

image.png

li feifei ](https://img.haomeiwen.com/i18072991/8c05bbf60504a96b.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

.加入注意力机制： Show, Attend and Tell: Neural Image Caption Generation with Visual Attention
将输入序列编码成语义特征hnhn再解码,但是因为hnhn的长度限制，会使得对于长句的翻译精度降低，论文《Neural machine translation by jointly learning to align and translate》提出了一种Attention机制，不再使用统一的语义特征，而让Decoder在输入序列中自由选取需要的特征，大大提高了Encoder-Decoder的模型性能。《Show, Attend and Tell: Neural Image Caption Generation with Visual Attention》利用Attention机制对原来的Encoder-Decoder机制进行改进。具体的就是利用CNN的空间特性，给图片的不同位置都提取一个特征，有了含位置信息的特征，Decoder在解码时拥有在这196个位置特征中选择的能力，这就是Attention机制。下图展示了一些例子，每个句子都是模型自动生成的，在图片中用白色高亮标注了生成下划线单词时模型关注的区域：

image.png

网友评论

本文标题：看图说话素材与encode-decoder NIC(Neural

本文链接：https://www.haomeiwen.com/subject/fqcxlctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

看图说话素材与encode-decoder NIC(Neural

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读