ELMO笔记

ELMO笔记

作者: 柴柴总 | 来源:发表于2020-02-28 21:28 被阅读0次

[NLP论文笔记] Deep contextualized wo
ELMO笔记
序列建模（八）：GPT、BERT、GPT-2、ALBERT --
ELMo
ELMo 的研究
ELMo
Note 2: ELMo
美剧Billions/亿万 S1E1(23-28minute)
elmo 实验心得及elmo个人理解
论文-Deep contextualized word repr

ELMo全程为Embeddings from Language Models，顾名思义，它是基于语言模型的

为什么要提出ELMO？
有些单词具有一词多义的性质，而word2vec模型学出来的每个单词只有一个固定的词向量

ELMO比起之前词向量模型如word2vec的好处是能够动态地学出在上下文的词向量

模型结构

lstm语言模型正向过程，当前单词之和它之前的单词有关

反向过程，当前单词只和它之后的单词有关

最大化目标函数

N指的是句子里的单词数目
得到每个单词有2L+1个表示，L指层数，2L因为是双向LSTM，层数论文用的是2层，x即图1中的E（2L+1里的1），对token编码，论文中用的是CNN对字符编码，最后一层bilstm输出接softmax预测当前词的下一个单词

预训练完成后，通过下列公式对每层表示做加权平均，当L为2时，s有3个参数（2层bilstm 和第一层的x embedding），s根据下游任务调节学习得到

这个参数需要人为设置，根据不同任务设置不同的值（可调参）

参考资料：

https://zhuanlan.zhihu.com/p/63115885

相关文章

[NLP论文笔记] Deep contextualized wo
Deep contextualized word representations(ELMo)阅读笔记本文是对论文...
ELMO笔记
ELMo全程为Embeddings from Language Models，顾名思义，它是基于语言模型的为什么...
序列建模（八）：GPT、BERT、GPT-2、ALBERT --
[李宏毅-ELMO、BERT、GPT视频笔记link[https://www.jianshu.com/p/f4ed...
ELMo
ELMo: Embeddings from Language Models ELMo用到上文提到的双向的langu...
ELMo 的研究
ELMO 的全称是 Embedding from Language Models ELMo于今年二月由AllenN...
ELMo
1.Deep contextualized word representations2.NAACL2018 一种新...
Note 2: ELMo
Deep contextualized word representations ELMo (Embeddings...
美剧Billions/亿万 S1E1(23-28minute)
原文 Whoa! Whoa, whoa! Watch it, there, Elmo! No! Get down,...
elmo 实验心得及elmo个人理解
1. 名词：ELMO：哈工大LTP 开发的动态词向量。问题一：何为动态词向量：普通的词向量，是静态的，也就是一...
论文-Deep contextualized word repr
1. 简称论文《Deep contextualized word representations》简称ELMo，...

网友评论

本文标题：ELMO笔记

本文链接：https://www.haomeiwen.com/subject/xqqrhhtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|ELMO笔记|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！