SeqGAN学习笔记（二）

SeqGAN学习笔记（二）

作者: p_w | 来源:发表于2020-02-10 00:28 被阅读0次

SeqGAN学习笔记（二）
SeqGAN学习笔记（三）
SeqGAN学习笔记（一）
序列对抗网络SeqGAN
SeqGAN解读
seqgan
JavaScript学习笔记二
MySQL 学习实践笔记（四）
MySQL 学习实践笔记（三）
MySQL 学习实践笔记（二）

GAN应用在图像领域取得了巨大的成功，然而在离散序列生成领域尤其是NLP领域却遇到了困难，原因在于判别器的判断信号难以“传回”生成器。
首先，我们回顾一下在使用MLE训练生成器时：

RNN作为生成器

如上图所示，每一个预测出的词都与真实值做对比计算loss，再加起来作为最终的loss，计算梯度，指导生成器的调参。然而，在GAN网络中，判别器只给出“真”和“假”也就是0和1，在这种情况下，判别器只能指导生成器略微（slightly change）的调参（目前这么理解，不知道是否正确）。这种情况对使用连续值表示的图像是可以的，然而文本都是离散值，slightly change很难影响Sampling的结果，例如：
生成器生成了一个token的vector：[0.1, 0.33, 0.57]，sample之后对应的one-hot vector是[0, 0, 1]，对应的词是“我”。然而生成器进行slightly change之后再生成的vector是：[0.11, 0.35, 0.54]，sample之后的结果仍然是[0, 0, 1]，对应的词是“我”。
以上情况就是将GAN应用在离散数据中的困境。
SeqGAN的作者在进行参考后，选择使用强化学习中的policy gradient来解决这个问题。policy gradient有大牛的文章解释的很清楚，可以搜索参考。

相关文章

SeqGAN学习笔记（二）
GAN应用在图像领域取得了巨大的成功，然而在离散序列生成领域尤其是NLP领域却遇到了困难，原因在于判别器的判断信号...
SeqGAN学习笔记（三）
上回书说到在GAN中判别器只给生成器生成的句子一个真假的判断，不能像MLE一样每一个词都计算loss，在离散序列生...
SeqGAN学习笔记（一）
本篇文章为本人目前对论文《SeqGAN: sequence generative with adversarial...
序列对抗网络SeqGAN
SeqGAN源自2016年的论文《SeqGAN: Sequence Generative Adversarial ...
SeqGAN解读
SeqGAN的概念来自AAAI 2017的SeqGAN: Sequence Generative Adversar...
seqgan
生成器的离散输出将判别器的梯度更新传递给生成器比较困难的。其次。判别器只能判别整个序列，将生成器建模为强化学习中的...
JavaScript学习笔记二
JavaScript学习笔记二个人学习笔记参考阮一峰的JavaScript教学学习笔记二是对学习笔记一的补充 J...
MySQL 学习实践笔记（四）
MySQL 学习实践系列 MySQL 学习实践笔记（一） MySQL 学习实践笔记（二） MySQL 学习实践笔记...
MySQL 学习实践笔记（三）
MySQL 学习实践系列 MySQL 学习实践笔记（一） MySQL 学习实践笔记（二） MySQL 学习实践笔记...
MySQL 学习实践笔记（二）
MySQL 学习实践系列 MySQL 学习实践笔记（一） MySQL 学习实践笔记（二） MySQL 学习实践笔记...

网友评论

本文标题：SeqGAN学习笔记（二）

本文链接：https://www.haomeiwen.com/subject/cfjnxhtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|SeqGAN学习笔记（二）|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！