美文网首页
句向量表示的方式

句向量表示的方式

作者: 云彩修建站站长 | 来源:发表于2019-10-18 21:18 被阅读0次

句向量,更高维度的文档向量的表示一直都是一个难题,至今都没有一种较好的表示方法。下面从传统句向量的表示方法和深度学习的表示方法两方面来总结下。
下面的描述中,句子代表句子和文档。

1. 传统的表示方法

  1. bag of words:词袋模型,缺点是忽略了单词的顺序;忽略了单词的语义。
  2. bag of words(tfidf版):词袋模型中的词频变为了tfidf值。
  3. LDA:使用句子的主题分布来表示句子。
  4. average word vectors:对词向量求平均的方法来表示句向量。
  5. tfidf-weighting word vectors:同4类似,不过4中每个词向量的权重是\frac{1}{词语总数},这里的权重变为了tfidf值
  6. doc2vec:直接对doc进行训练产生doc向量,也会产生副产品:词向量

1.1 doc2vec的原理

在这里介绍下doc2vec的原理,如果了解word2vec的原理,那么就会很容易理解doc2vec,doc2vec同word2vec的训练架构一样,分为:

  1. PV-DM(Distributed Memory Model of paragraph vectors)类似于word2vec中的CBOW模型


    PV-DM.jpg
  2. PV-DBOW(Distributed Bag of Words of paragraph vector类似于Word2vec中的skip-gram模型


    PV-DBOW.jpg

关于模型训练和预测时的一些解释:

  1. 在训练每句话的时候,训练那句话对应的vec都会和句子中的一部分词向量一块训练。具体和句子中哪些词一块训练,会有一个滑动窗口,只训练窗口的里词。
  2. 在预测的时候,词向量和模型的参数都是固定不变的,只有句向量是未知的,初始化句向量后,随着窗口的滑动,句向量不断地被训练,直到收敛为止。

相关文章

  • 句向量表示的方式

    句向量,更高维度的文档向量的表示一直都是一个难题,至今都没有一种较好的表示方法。下面从传统句向量的表示方法和深度学...

  • 线性代数学习-向量

    向量是一组数的基本表示 一个二维向量通常表示为 方向与大小 向量加法表示 向量乘法 数量相乘 单位向量 只关心方向...

  • 文本分类与文本相似度

    1. 词向量 hash: simhashword2vec: 低维稠密向量,每一维表示词语的潜在特征,该特征捕获了句...

  • 2D射影几何与变换

    1.基本表示 列向量:粗体符号如x总是表示列向量,其转置表示行向量。 欧氏空间:,为维度。 射影空间:,为维度。 ...

  • 常见的词向量类型

    最近面试中经常被问到常用的词向量的表示方式,这里就整理一下常见的类型 1、词频做向量值 Bag-of-words ...

  • 五章 向量 代数及空间解析几何

    1.定义既有大小又有方向的量叫向量*2.表示方法有向线段的长度表示向量的大小,箭头所指的方向表示向量的方向。以A为...

  • 【数学】矩阵&向量

    单个向量的数学表示是一阶矩阵。 多个向量组合一起表示为矩阵。

  • learnfromzero_0

    一、线性回归 1 流程 线性回归:1 通过可视化寻找模型->2 表示和推导模型->表示方式使用矩阵,向量内积、点积...

  • 第二节 向量与线性代数入门

    1向量 verctors 没有绝对的起始结束位置表示方向和长度 单位向量: 提个长度为1的向量单位向量 = a向量...

  • 向量及其运算

    一、什么是向量 向量的表示: 以 为起点、 为终点的有向线段表示的向量记为 , 有时也用一个黑体字母(书写时...

网友评论

      本文标题:句向量表示的方式

      本文链接:https://www.haomeiwen.com/subject/pbpwmctx.html