Glove和fastText

Glove和fastText

作者: Jarkata | 来源:发表于2021-03-13 13:04 被阅读0次

Glove和fastText
利用Word2vec生成句向量（一）
词向量
nlp中的词向量对比：word2vec/glove/fastTe
fastText源码分析
常见文本分类模型
四步理解GloVe！(附代码实现)
NLP入门 - 新闻文本分类 Task4
word2vec [5] Glove
好的机器学习列表

本文介绍两种更新一点的词向量，它们分别是 2014 年由 Stanford 团队发表的 Glove 和 2017 年由 Facebook 团队发表的 fastText

1.Glove

Glove 使用了词与词之间的共现（co-occurrence）信息。定义 $X$ 为共现词频矩阵，其中元素 $x_ij$ 表示词 $j$ 出现在词 $i$ 的环境(context)的次数。
这里的“环境”有多种定义。

1.1 共现概率比值

Glove 论文里展示了以下一组词对的共现概率与比值

由此可见，共现概率比值能比较直观地表达词之间的关系。Glove试图用有关词向量的函数来表达共现概率比值。

1.2 用词向量表达共现概率比值

Glove 的核心在于使用词向量表达共现概率比值。而任意一个这样的比值需要三个词 $i$ 、 $j$ 和 $k$ 的词向量。对于共现概率 $P_{ij}=P(j|i)$ ，我们称词 $i$ 和词 $j$ 分别为中心词和背景词。我们用 $v$ 和 $\widetilde{v}$ 分别表示中心词和背景词的词向量。

我们可以用有关词向量的函数 $f$ 来表达共现概率比值：

需要注意的是，函数 $f$ 可能涉及的并不唯一。首先，我们用向量之差来表达共现概率的比值，并将上式改写成

由于共现概率比值是一个标量，我们可以使用向量之间的内积把函数 $f$ 的自变量进一步改写

由于任意一对词共现的对称性，我们希望以下两个性质可以同时被满足：

为了满足以上两个性质，一方面我们令

并得到

f(x)=exp(x)

。以上两式右边联立

上式两边取对数可得

另一方面，我们可以把上式中的

log(x_i)

替换成两个偏移项之和

b_i+b_k

，得到

将索引

i

和

k

互换，我们可以验证对称性的两个性质可以同时被上式满足
因此，对于任意一对词

i

和

j

，用它们的词向量表达共现概率比值最终可以被简化为表达他们共现词频的对数：

1.3 损失函数

上式中的共现词频是直接在训练数据上统计得到的，为了学习词向量和相应的偏移项，我们希望上式中的左边与右边越接近越好，给定词典大小 $|V|$ 和权重函数 $f(x_{ij})$ ，我们定义损失函数为

Glove使用一个词的中心词向量与背景词向量之和作为该词的最终词向量
关于 Glove 的一些公式推导，其实并不严谨，它只是提出了一些设计思路，为了满足那两个条件，共现词频应该设计成什么样。所以如果某一步推导看不懂也很正常，忽略过去就行了，只要知道最终的损失函数的性质就行

2 fastText

fastText 在使用负采样的 skip-gram 模型基础上，将每个中心词视为子词（subword）的集合，并学习子词的词向量

把使用负采样的skip-gram模型的损失函数

直接替换为

我们可以看到，原中心词向量被替换成了中心词的子词向量的和。与整词学习（word2vec 和 Glove）不同，词典以外的新词的词向量可以使用 fastText 中相应的子词向量之和

fastText 对于一些特定语言较重要，例如阿拉伯语、德语和俄语。例如，德语中有很多复合词，例如乒乓球（英文 table tennis）在德语中叫 "Tischtennis"。fastText 可以通过子词表达两个词的相关性，例如 "Tischtennis" 和 "Tennis"

如果遇到一个新词，对于 fastText 来说，它可以从训练集中找出这个新词的所有子词向量，然后做个求和，就能算出这个新词的词向量了

参考

Glove和fastText

相关文章

Glove和fastText
本文介绍两种更新一点的词向量，它们分别是 2014 年由 Stanford 团队发表的 Glove 和 2017 ...
利用Word2vec生成句向量（一）
首先为什么是Word2vec？不是Glove也不是什么Fasttext等其他的词向量？Glove词向量的训练与部署...
词向量
目前词向量主要用的技术 word2vec fasttext glove 1 one-host编码 one-hot编...
nlp中的词向量对比：word2vec/glove/fastTe
本文以QA形式对自然语言处理中的词向量进行总结：包含word2vec/glove/fastText/elmo/be...
fastText源码分析
1.使用Clion调试fastText源代码2.fasttext源码剖析3.fastText 源码分析
常见文本分类模型
1. Fasttext 1.1 模型架构 Fasttext模型架构和Word2vec的CBOW模型架构非常相似，下...
四步理解GloVe！(附代码实现)
1. 说说GloVe 正如GloVe论文的标题而言，GloVe的全称叫Global Vectors for Wor...
NLP入门 - 新闻文本分类 Task4
Task4 基于深度学习的文本分类1 - fastText 学习目标学习FastText的使用和基础原理学会使...
word2vec [5] Glove
Glove 1.Introduction Glove（Global Vectors for Word Repres...
好的机器学习列表
1. FastText等 facebookresearch/ParlAI**fastText**2018 年最富含...

网友评论

机器学习

本文标题：Glove和fastText

本文链接：https://www.haomeiwen.com/subject/ixbnfltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

机器学习

关于我们|服务条款|联系我们|Glove和fastText|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！