Cross-lingual Language Model Pre

Cross-lingual Language Model Pre

作者: VanJordan | 来源:发表于2019-06-03 19:44 被阅读0次

只能说太牛逼了
为所有的语言使用同一个bpe词表
学习bpe也是有窍门的就是要按照语料数量进行加温度的多项式分布进行采样，温度是0.5，为了避免bpe中语料过的语言占的比重过大。
改进就是原来仅仅是使用无监督方法学出来的embedding来学习词表，现在是直接初始化encoder了和decoder，初始化的方法就是主要是下面的监督预训练任务管用。
而且作者的预训练方法不仅仅在无监督机器翻译德英上超过sota 9个点，而且在有监督机器翻译上提高了4个belu是Romanian-English的sota.

相关文章

网友评论

本文标题：Cross-lingual Language Model Pre

本文链接：https://www.haomeiwen.com/subject/jjzcxctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Cross-lingual Language Model Pre|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！