NLP-语言模型

作者: Rockelbel | 来源:发表于2018-06-27 23:19 被阅读6次

https://mp.weixin.qq.com/s/XtFyq5o-JO2wYZh-4mKmAQ

语言模型的目标:判断某句话是不是按照某种语言的习惯正确表达出来,本质就是判断一句话符合习惯的概率

N-gram模型

基于统计,当下应用最广,(马尔科夫假设)假定某个词的出现的概率只跟前面出现的少数几个词相关

根据已有的语料库,计算最有可能是’人话’的句子

n更大时对下一个词的约束性信息更多,有更大辨别力,n更小时在训练语料库中的次数更多,有更高可靠性。n为2时,就是一个二元模型

例子:备选项是根据概率计算出的前几位

例子:输入法中根据拼音也需要利用模型来匹配概率最高的文字

N-pos模型

将词按照语法功能进行分类,由这些词类决定下一个词出现的概率(part of speech)。需要大规模的语料训练。

基于决策树的语言模型

考虑了相近的概率分布。

举例:训练语料库中一个词W,前一个词W-1,这样数据点为(W,W-1)=(已经,吃过)

动态语言模型

上述三中均是静态语言模型,预先从训练语料库找那个估算好。能够根据词在局部文本中出现的情况,动态调整语言模型中的概率分布数据的语言模型,使之动态、自适应、基于缓存的模型,可以有效避免数据稀疏的问题。

相关文章

  • NLP-神经语言模型:文本生成

    一、引言 在NLP-统计语言模型中已经简要介绍过语言模型的相关知识,该文中已阐述语言模型的应用场景和一些传统的实现...

  • NLP-语言模型

    https://mp.weixin.qq.com/s/XtFyq5o-JO2wYZh-4mKmAQ 语言模型的目标...

  • NLP-统计语言模型的平滑方法

    一、引言 在NLP-统计语言模型中简要介绍了统计语言模型的原理和实现方法,以bigram为例,计算了 的概率,这是...

  • NLP-统计语言模型

    一、数学模型 1、由来 语言模型起初是为了计算句子的合理性。在我们看来一句话是否合理主要还是判断其是否合乎语法,表...

  • Deep Learning in NLP-词向量和语言模型

    Deep Learning 算法已经在图像和音频领域取得了惊人的成果,但是在 NLP 领域中尚未见到如此激动人心的...

  • CMU Sphinx语音识别入门:构建语言模型

      CMUSphinx支持多种语言解码模型,包括:关键字列表模型、语法模型、统计语言模型和语言语音模型。不同的模型...

  • NLP-词向量:词袋模型

    一、前言 词袋模型是早些年使用的词向量模型,该模型假设每个词都是独立的,仅仅使用词在文章中的频率来决定如何表达词,...

  • 一文让你了解中文分词

    分词,是NLP-自然语言处理(还不了解NLP的小伙伴点这里跳转)的重要步骤。 顾名思义,分词就是将句子、段落、文章...

  • TensorFlow 实战Google深度学习框架(第2版)第九

    第九章:自然语言处理 * 9.1语言模型的背景知识 * 9.1.1语言模型简介 * 9.1.2语言模型的评...

  • 语言模型

    什么是语言模型 语言模型建模方法分为 统计语言模型 和 规则语言模型 两大类,前者完全依靠大文本的数据,用统计的方...

网友评论

    本文标题:NLP-语言模型

    本文链接:https://www.haomeiwen.com/subject/cclwyftx.html