美文网首页
深度学习——计算任意词距离模型

深度学习——计算任意词距离模型

作者: 天禧68 | 来源:发表于2018-11-04 21:17 被阅读0次
FP-Growth算法实现词距离计算

对于句式非常整齐,有很强的规律性。而对于这种句式的挖掘,有一类算法非常擅长,那就是频繁模式的数据挖掘算法。

N-Gram算法实现词距离计算

使用N-Gram计算词距离的方法主要有两种,一种是基于公共子串的方法,另一种是embedding的方法。
N-Gram(有时也称为N元模型)是自然语言处理中一个非常重要的概念。因为对于字或词的连接关系,我们有这样的一种认知(或者叫假设):即后一个字/词的出现概率只与它前面的n个字/词有关系,而与其他元素没有关系。所以我们用一个N元窗口去逐个扫描字/词的前后连续元素,那么就会得到一个字/词的连续向量。基于逐个向量我们就可以对不同的字/词计算其距离。如果N=2,则为bi-gram,如果N=3,则为tri-gram。
embadding是文本处理中的一个非常重要的步骤,随着深度学习不断深度的应用,这项工作就越显得越来越重要,并且很多研究学者的工作显示,词向量能很好地反映词的语义属性,比如词向量之间可以进行加、减操作,并且操作后的向量能得到对应语义的向量,经常用到的例子是:国王-男人+女人=皇后。在国外的一个购物 网站,运用词向量进行服装推荐,用户选择一款衣服,再输入一个单词就可以推荐出对应语义的服装,比如对于一个条纹T恤+pregnant,则推荐对应的孕妇装款式。

BP算法实现词距离计算
48AC99C37CE3EBDE9DF256878A96BE26.png

相关文章

  • 深度学习——计算任意词距离模型

    FP-Growth算法实现词距离计算 对于句式非常整齐,有很强的规律性。而对于这种句式的挖掘,有一类算法非常擅长,...

  • 词向量原理

    了解词向量要从语言模型说起,语言模型其实就是计算任意一个句子的概率。 经典的语言模型是n-gram模型,该模型假设...

  • Tensorizing Neural Networks 笔记

    Abstract 深度学习模型需要大量的计算资源,特别是全连接层。这使得这些深度学习模型很难用在低端设备上,并且这...

  • TPU: 设计和拆解ASIC芯片

    GPU天生适合海量、并行的矩阵运算、于是大量用在深度学习的模型训练上深度学习中计算量最大的是什么呢 ? 深度学习的...

  • 深入理解 LSTM 的 BPTT 过程及实现

    ppt 参见 tensorflow 计算模型及深度学习在目标识别上的方法介绍.pdf

  • 深度学习

    深度学习:通过多层非线性变换对高复杂性数据建模算法的合集。 线性模型的局限性 线性模型的最大特点是任意线性模型的组...

  • Note - 深度学习模型的部署

    开发深度学习模型一般需要借助深度学习库(Tensorflow、pytorch),以下对工业环境部署深度学习模型进行...

  • 揭秘支付宝中的深度学习引擎:xNN

    导读:本文介绍支付宝App中的深度学习引擎——xNN。xNN通过模型和计算框架两个方面的优化,解决了深度学习在移动...

  • 深度学习技术发展现状浅析

    近年来,深度学习逐渐成为人工智能领域的研究热点和主流发展方向。深度学习是由多个处理层组成的计算模型,学习具有多个抽...

  • 深层神经网络

    深度学习 有两个非常重要的特性:多层和非线性 非线性: 线性模型的输出结果为输入的加权和。线性模型的最大特点是任意...

网友评论

      本文标题:深度学习——计算任意词距离模型

      本文链接:https://www.haomeiwen.com/subject/ekydxqtx.html