美文网首页
fasttext-advance版本

fasttext-advance版本

作者: 小小兰哈哈 | 来源:发表于2019-08-01 11:13 被阅读0次

该方法的优化点是将位置信息添加到word2vec的计算中。

word2vec有两种实现方式,一种是cbow,基于context(上下文S词)预测中心词,另一种是skipgram,基于中心词预测上下文。 主要的优化方向是cbow.

1. 标准的cbow的实现

有两种实现模式:

1)基于公式\sum_{T}^tlogp(w_{t}|c_{t}),其中c_{t}代表句向量,在fasttext中的求法就是w的简单均值。

2)考虑到随机选取一部分非中心词当做错误集合,将错误集合的预测结果和中心词的预测当成两类,加入loss函数,那么loss函数的公式可以写为:

\sum_{T}^tlog(1+e^{-s(w,c)})+ \sum_{w_{c}\in N_{c}}log(1+e^{s(w,c)})

其中:s(w,C)=\frac{1}{|C|} \sum_{w_{i}\in C}C_{i}w_{i}^T

2. 基于位置的cbow

该方案中,基于位置的考虑非常简单容易实现,计算成本低。

对于每个需要预测的词w, 建立一个基于距离P的文本窗口,w是通过该文本窗口中的词预测出来。

v_{c} = \sum_{p\in P}d_{p}\odot w_{t+p}

也就是说,将原有标准cbow实现中的文本向量是w的平均,改成基于位置权重的词向量叠加。

三. 效果:

论文中,对比了cbow, cbow+phrase(ngream),cbow+phrase+weight(本方案)方法在

common crawel数据集的结果如下:

可以看出,本方案取得了较优的提升。

相关文章

  • fasttext-advance版本

    该方法的优化点是将位置信息添加到word2vec的计算中。 word2vec有两种实现方式,一种是cbow,基于c...

  • 【版本】1【版本】

    【版本】1【版本】 【下载链接】www.9258km.999km.cn

  • iOS版本、iPhone版本、Xcode版本比对

    下面的链接,方便以后好看。 iOS版本、iPhone版本、Xcode版本比对

  • 4、版本

    预览版本体验版本开发版本审核版本线上版本

  • 版本

    这一天,戊戌年五月二十日。 上午骄阳似火,汗如雨下;中午忽然黑云压城,狂风大作,暴雨如注;半下午雨...

  • 版本

    【20180620】

  • 版本

    关于我 有很多版本—— 是流浪的乞人 是丢失的公主 是前朝的贵妃 是寂寞的皇后 是天使 是魔鬼 是妖也是佛 是无所...

  • 版本

    2018.11.19V1.0发布,具备基本的工资条邮箱群发功能!

  • 版本

    源码流程 使用 这里列举了三种常用的版本方式 settings.py urls.py views.py 全局使用

  • 版本

    当前版本 3.2 嗯,就这样

网友评论

      本文标题:fasttext-advance版本

      本文链接:https://www.haomeiwen.com/subject/xswfdctx.html