seqgan

作者: ericsunn | 来源:发表于2017-10-11 23:52 被阅读0次

生成器的离散输出将判别器的梯度更新传递给生成器比较困难的。其次。判别器只能判别整个序列,将生成器建模为强化学习中的策略,通过策略梯度忽略策略微分。

简单的句子表示可以将句子中词的向量相加求平均,或者基于其他信息如idf、POS等权重加权。但这样会引入噪声。论文Distributed Representations of Sentences and Documents中提出一个paragraph vector,一个非监督学习算法,从变长文本如句子、段落、文档中学习固定长度的特征表示。分类和聚类的机器学习算法通常需要固定长度的向量,最常见的文本的固定长度向量是bag-of-words或bag-of-n-grams。显然,BOW这种表示丢失词的顺序,不同含义的句子只要它们的词相同,那么它们就有相同的表示。bag-of-n-grams考虑短文本的词序,但会存在稀疏和高维的问题。

算法原理:

用单词序列预测下一个词的概率,这个预测任务用一个多类别分类器解决,如softmax。实际当中,hierarchical softmax比softmax更好,因为它训练快。在本文中,hierarchical softmax的结构是一个二分Huffman树,根据词频建立Huffman树,同Mikolov相同。

相关文章

  • 序列对抗网络SeqGAN

    SeqGAN源自2016年的论文《SeqGAN: Sequence Generative Adversarial ...

  • SeqGAN解读

    SeqGAN的概念来自AAAI 2017的SeqGAN: Sequence Generative Adversar...

  • seqgan

    生成器的离散输出将判别器的梯度更新传递给生成器比较困难的。其次。判别器只能判别整个序列,将生成器建模为强化学习中的...

  • SeqGAN学习笔记(一)

    本篇文章为本人目前对论文《SeqGAN: sequence generative with adversarial...

  • SeqGAN: Sequence Generative Adve

    github链接:https://github.com/LantaoYu/SeqGAN论文及appendix里有很...

  • 《SeqGAN: Sequence Generative Adv

    该论文发表在AAAI 2017会议,如果要把GANs应用到序列数据生成上,则必须参考一下该文章。本人是强化学习相关...

  • SeqGAN:Sequence Generative Adver

    论文:SeqGAN代码:Github 这篇paper主要介绍了GAN在文本生成上的应用。GAN在2014年被提出之...

  • RL for LM, SeqGAN, and MaliGAN

  • SeqGAN学习笔记(三)

    上回书说到在GAN中判别器只给生成器生成的句子一个真假的判断,不能像MLE一样每一个词都计算loss,在离散序列生...

  • SeqGAN学习笔记(二)

    GAN应用在图像领域取得了巨大的成功,然而在离散序列生成领域尤其是NLP领域却遇到了困难,原因在于判别器的判断信号...

网友评论

      本文标题:seqgan

      本文链接:https://www.haomeiwen.com/subject/wcngyxtx.html