《Factored Neural Machine Transla

作者: wai7niu8 | 来源:发表于2016-09-25 14:26 被阅读0次

《Factored Neural Machine Transla
nlp-attention机制
论文笔记之DeepFM: A Factorization-Mac
第五课第三周编程作业assignment-Neural+mach
机器学习、视觉、图形学的会议和期刊
4.NLP with Attention Models
文献分享——Chromatin interaction neur
人工智能速查表
Intro to Neural Networks and Mac
DeepFM模型

paper来源：arXiv.org

问题：

实验任务----属于机器翻译（NMT）任务，具体来说，本paper实验任务为英语翻译为法语；

paperwork----在传统NMT的“seq2seq+attention”的基础上引入先验知识/工具改进了decoder的结构，在一定程度上解决大词表(Large Vocabulary)和OOV（Out Of Vocabulary）问题；

摘要：

首先，作者使用morphological and grammatical analysis（形态学与语法分析器）来获取单词的因素表示，lemmas, Part of Speech tag, tense, person, gender and number等；

其次，作者改进了传统的NMT的decoder，把输出由一个变成了两个，分别表示lemmas和其他的factors，独立学习，然后重组为word；

由此带来的好处是，同样大的词表可以表示更多的词；再者，它可以生产词表中不存在的新词，减少OOV词项的出现频率；

形态学与语法分析器（本文使用的是MACAON）：

举例：法语词devient（对应英文词becomes）可以表示为devenir和“vP3#s”, devenir为lemma，可以理解为词根；“vP3#s”为factors，可理解为修饰限制词根的其他因素；v表示verb，P表示Present(时态)，3表示3rd person(第三人称),#表示无关性别，s表示单数；

网络结构：

传统的NMT结构图：

两个重要概念：seq2seq，attention