一、写在前面的话
这篇论文涉及文本风格迁移领域,其主要思路是放弃了常规风格迁移需要先编码出style variable 和 style-independent content vector的思路,直接在输入句子和style variable进行风格迁移,其中style variable由另一个网络控制,该网络通过几个任务来保证style variable是合理的,整体的思路其实类似对抗网络。另外,该论文在生成迁移风格的文本时,选用了Transformer。
二、论文笔记
下图是论文网络的整体架构,其主要由Transformer Network和Discriminator Network两部分构成,Transformer Network部分比较简单,就是一个端对端的生成结构
Discriminator Network则通过以下几个任务限制和对抗:
三、结果
论文通过两个Automatic Evaluation和Human Evaluation:
3.1 Automatic Evaluation
- (Style Control) fastText classifier
- (Content Preservation) BLEU score
- (Fluency) 5-gram KenLM
3.2 Human Evaluation
3.3 生成结果
总体来说,我个人非常喜欢这篇论文的思路,由于风格迁移缺乏平行预料,所以,使用对抗网络的方式引入损失从而进行训练,这样大大降低了模型对于平行预料的依赖。
网友评论