子词结构辅助机器翻译《Subword Regularizatio

子词结构辅助机器翻译《Subword Regularizatio

作者: 布口袋_天晴了 | 来源:发表于2019-07-29 20:42 被阅读5次

子词结构辅助机器翻译《Subword Regularizatio
NLP-机器翻译名词解释
embedding type
Generalization and Regularizatio
GENERALIZATION AND REGULARIZATIO
EMNLP · 2017 · Mimicking Word Em
CodeIgniter辅助函数简介
fastText
how to understand "Regularizatio
CS224N(12)-子词模型

论文
未提供代码

一、简介

又是一篇关于多语言机器翻译的论文，文中作者认为子词结构有助于翻译。如下图：

英语句子"Hello World"可以由多种子词结构序列进行表示。

二、模型

机器翻译通常会给出一个句对，需要翻译的句子X，以及翻译后的标注答案句子Y。<X，Y>。向上图那样，句子X可以被切分成很多序列，则X的字符串划分序列集合表示为 $x=(x_{1},...,x_{M})$ ，同样，目标答案句子Y也可以被切分成很多序列，Y的字符串划分序列集合表示为 $y=(y_{1},...,y_{N})$ 。
注：此处的字串的划分相对于空格的划分，会使同一个句子序列的表示多样化，即有很多种序列都可以表示同一个句子，如上图所示。

上式子是翻译模型的概率公式，在输入序列为x的前提下，预测下一个子词的概率，为序列的联合概率，其中是模型的参数。这个模型序列预测模型，可以选用RNN(循环时间网络)结构，或者其他非RNN模型也可。

三、目标函数

翻译模型的目标函数，一直都是平行语料的最大化对数似然函数。
平行语料用公式表达为：
$D=\left \{ <X^{s},Y^{s}> \right \}_{s=1}^{|D|}=\left \{ <x^{s},y^{s}> \right \}_{s=1}^{D}$
句对，变为子字符串序列对。
模型的最大化对数似然函数公式：

其中k表示从序列集合x、y中限制的序列采样数。x、y子字符串序列集合会有多种多样的序列，其数目>>k，所以模型训练的时候，各从x，y中取出k个序列来训练模型。

四、解码翻译分数

其中，是y句子的子字符串序列的长度，是用来平衡短句子的正实数参数。

五、实验结果

相关文章

子词结构辅助机器翻译《Subword Regularizatio
一、简介英语句子"Hello World"可以由多种子词结构序列进行表示。二、模型机器翻译通常会给出一个句对...
NLP-机器翻译名词解释
TMS:翻译项目管理系统 LSP:语言服务提供商 CAT：计算机辅助翻译 MT：机器翻译 MTPE：机器翻译+译后...
embedding type
Word , Phrase sentence subWord Char
Generalization and Regularizatio
Jesse Farebrother, Marlos C. Machado, Michael BowlingUniv...
GENERALIZATION AND REGULARIZATIO
Jesse Farebrother∗, Marlos C. Machado, Michael BowlingUni...
EMNLP · 2017 · Mimicking Word Em
EMNLP · 2017 · Mimicking Word Embeddings using Subword RN...
CodeIgniter辅助函数简介
作者：烨竹目录结构辅助函数参考数组辅助函数验证码辅助函数 Cookie 辅助函数日期辅助函数目录辅助函...
fastText
1.Enriching Word Vectors with Subword Information2.Bag of...
how to understand "Regularizatio
我们可以看到，L2正则化的损失函数在参数更新时，参数是按固定的比例减少的（一塔与拉姆达的乘积接近于0，图中标识有误...
CS224N(12)-子词模型
Subword Models 一、Morphology: Parts of words 在传统上，我们通常将语素作...

网友评论

顶会优质论文解读

本文标题：子词结构辅助机器翻译《Subword Regularizatio

本文链接：https://www.haomeiwen.com/subject/ocyirctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

顶会优质论文解读

热点阅读

顶会优质论文解读

关于我们|服务条款|联系我们|子词结构辅助机器翻译《Subword Regularizatio|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！