NLP模型

作者: Ary_zz | 来源:发表于2020-01-13 15:02 被阅读0次

2020-01-11

word2vec

词袋

每个词有一个对应的onehot编码
可以得到文本的向量化结果,向量长度为词典大小,向量各个位置的值代表该词出行次数,存在的问题:
1.纬度灾难
2.未保留语序
3.语义鸿沟

n-gram

认为一个词的出现只与它前面n-1个词相关


image.png

连续词袋

去掉了最耗时的非线性隐藏层


image.png

假设目标词前后各取k个词,即窗口的大小是k,那么CBOW模型预测的将是


image.png

输入层到隐藏层,求和平均


image.png

隐藏层到输出层


image.png

最大化函数


image.png

skip gram

image.png

kip-Gram模型预测的是 [图片上传失败...(image-abc294-1578728260679)]

由于图中词前后只取了各两个词,所以窗口的总大小是2。假设词前后各取k个词,即窗口的大小是k,那么Skip-Gram模型预测的将是


image.png

输入层到隐藏层


image.png
隐藏层到输出层
image.png

最大化函数


image.png

参考
https://www.cnblogs.com/xlturing/p/6136690.html

相关文章

  • NLP模型

    2020-01-11 word2vec 词袋 每个词有一个对应的onehot编码可以得到文本的向量化结果,向量长度...

  • 彻底理解 Google BERT 模型

    BERT 模型是 Google 在 2018 年提出的一种 NLP 模型,成为最近几年 NLP 领域最具有突破性的...

  • 极简父母

    九型分三类 性格决定命运 性格里包含 情感模型~NLP 思维模型 行为模型

  • 分类学习器的构建

    目录 变量选择 变量筛选 模型选择 变量预处理 模型设计和训练 模型优化 模型检验 1、特征选择 在NLP模型、机...

  • NLP入门(一)词袋模型及句子相似度

      本文作为笔者NLP入门系列文章第一篇,以后我们就要步入NLP时代。  本文将会介绍NLP中常见的词袋模型(Ba...

  • 兼容并“包”NLP评价指标:Robustness Gym框架

    ©NLP论文解读原创•作者 | 吴雪梦Shinemon 研究方向 | 计算机视觉 导读说明 在NLP模型被建立后,...

  • NLP - Transformer模型

    简介 Transformer模型由Google提出,发表在NIPS 2017会议上。是一种完全基于注意力机制的模型...

  • NLP幸福密码学习心得(一)

    【学习内容】 NLP和心理学概论/心智模型 【我的收获】 首先搞清楚了NLP是干嘛用的,NLP是帮人们过上幸福生活...

  • 自然语言处理_自学习平台

    前两周协助项目验收验收,使用了下NLP自学习平台,简单做个记录 提供了许多针对不同场景优化过的NLP模型。NLP自...

  • [NLP论文笔记] BERT: Pre-training of

    0. 写在前面  google发布了BERT模型,刷榜了各类NLP任务,成为NLP领域的ImageNet,并随后公...

网友评论

      本文标题:NLP模型

      本文链接:https://www.haomeiwen.com/subject/rabvactx.html