BERT: Pre-training of Deep Bidir

BERT: Pre-training of Deep Bidir

作者: panda1942 | 来源:发表于2018-10-20 21:08 被阅读0次

BERT: Pre-training of Deep Bidir
BERT: Pre-training of Deep Bidir
BERT中文翻译及相关实践代码
Note 5: BERT
预训练语言表达模型之BERT
BERT 论文笔记
BERT - 论文解读
BERT：深度双向预训练语言模型
BERT
BERT Paper Review

主要结构仍是 Transformer
Input:
a. WordPiece embeddings
b. learned positional embeddings, up to 512 tokens。
c. 增加了一个特殊的 token: [CLS], 用于分类任务。这个token的deep feature用于分类任务。
d. Sentence pairs, 两个句子合成一句，并用一个特殊的 token: [SEP]隔开。同时增加两个可训练的sentence embedding A 和 B，分别与第一句和第二局的每个tokens embedding concate在一起。
e. 对于单句，sentence embedding A 也会使用，与所有token embedding concate。
预训练的方式，最大的区别
a. 不是简单的left-to-right或者right-to-left的语言模型训练方式。而是mask部分tiokens，然后预测这部分的tokens，因此可以利用全句信息。其实也可以认为是学习句子的context representation，比起LM这种预训练更好。
具体：15%随机mask。同时其中80%替换为一个特殊的 token: [MASK]， 10%替换为随机的tokens，10%不变。因为训练时只会预测15%的tokens，相比于LM训练速度下降。
b. 句子预测，Sentence pairs，判断这两个句子是不是相关的。
预训练细节：
sentence可能是部分文本，不仅仅是一句。因为positional embeddings限制，input长度小于512。
激活函数用的是gelu。
base model， 4 cloud tpus 训练4天。large model， 16 cloud tpus 训练4天。

利用Masked LM和Next Sentence Prediction，相比于LM，直观上可以学习更好的句子的context representation。利用大规模数据，选择合适的非监督任务进行预训练，才能更好的进行transfer。

相关文章

BERT: Pre-training of Deep Bidir
主要结构仍是 Transformer Input:a. WordPiece embeddingsb. lear...
BERT: Pre-training of Deep Bidir
1. 简介大名鼎鼎的BERT，基于目前流行的transformer结构，一经推出就刷新了11个NLP任务的SOT...
BERT中文翻译及相关实践代码
BERT Pre-training of Deep Bidirectional Transformers for ...
Note 5: BERT
BERT: Pre-training of Deep Bidirectional Transformers for...
预训练语言表达模型之BERT
BERT: Pre-training of Deep Bidirectional Transformers for...
BERT 论文笔记
BERT：Pre-training of Deep Bidirectional Transformer for L...
BERT - 论文解读
BERT:【 Pre-training of Deep Bidirectional Transformers fo...
BERT：深度双向预训练语言模型
论文标题：BERT: Pre-training of Deep Bidirectional Transformer...
BERT
1.BERT: Pre-training of Deep Bidirectional Transformers f...
BERT Paper Review
BERT-Google Code Pre-training of Deep Bidirectional Trans...

网友评论

本文标题：BERT: Pre-training of Deep Bidir

本文链接：https://www.haomeiwen.com/subject/cxamzftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|BERT: Pre-training of Deep Bidir|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！