美文网首页
2021-05-09 ch11 语言模型

2021-05-09 ch11 语言模型

作者: 柠樂helen | 来源:发表于2021-05-15 22:20 被阅读0次

语言模型:用于判断一句话是否语法通顺
给已经训练好的语言模型可以对任何一个文本给出概率,概率越高说明语法上越通顺

链式概率 P(今天是周日) = P(今天)P(是|今天)P(周日|今天,是)
语言模型会算好 P(今天)、P(是|今天)、P(周日|今天,是) 每一项的概率值是多少

问题:当句子非常长的时候,语料库很少有相同的句子,很容易出现P=0的情况

马尔可夫假设:当前中心词只考虑前面N个单词的条件概率
马尔科夫假设(1阶、2阶、3阶。。。对应 N = 1、2、3)


image.png

一阶马尔可夫假设:Bigram
第一个 P(w1)= 词频 / 语料单词数


image.png

【总结】
语言模型的概率值可基于语料库来统计
根据使用的马尔科夫假设的不同,可以把语言模型分为unigram, bigram, trigram, ngram。。。
当考虑多个单词的时候,条件概率往往变得稀疏,导致大部分都变成0。

【评估】困惑度,阶数越大,模型越复杂,困惑度越小,越准确也越过拟合


image.png

相关文章

  • 2021-05-09 ch11 语言模型

    语言模型:用于判断一句话是否语法通顺给已经训练好的语言模型可以对任何一个文本给出概率,概率越高说明语法上越通顺 链...

  • CMU Sphinx语音识别入门:构建语言模型

      CMUSphinx支持多种语言解码模型,包括:关键字列表模型、语法模型、统计语言模型和语言语音模型。不同的模型...

  • TensorFlow 实战Google深度学习框架(第2版)第九

    第九章:自然语言处理 * 9.1语言模型的背景知识 * 9.1.1语言模型简介 * 9.1.2语言模型的评...

  • 语言模型

    什么是语言模型 语言模型建模方法分为 统计语言模型 和 规则语言模型 两大类,前者完全依靠大文本的数据,用统计的方...

  • 语言模型

    模型:可以量化,可以打分。 语言模型 概率语言模型(统计语言模型) 用处示例:输入法、机器翻译、语音识别等。 N-...

  • 词向量原理

    了解词向量要从语言模型说起,语言模型其实就是计算任意一个句子的概率。 经典的语言模型是n-gram模型,该模型假设...

  • NLP复习(Lecture 9-15)

    Lecture 9 Language Model 语言模型分两类——概率语言模型和结构语言模型 1. N-Gra...

  • 数据库原理

    关系模型 关系模型 实体关系模型 对象关系模型 半结构化数据模型 XML(扩展标记语言) 数据语言 DML 数据操...

  • 零基础进行神经网络语言建模文章

    摘要:本文从最简单的语言模型开始介绍,以优化模型性能为目标,由浅到深的介绍了神经网络模型在语言模型中的应用。 语言...

  • 中文分析3:基于语言模型的无监督分词

    一、语言模型 1、什么是语言模型 语言模型就是计算条件概率的模型。 其中w1,w2,…,wn−1是句子中的前n−1...

网友评论

      本文标题:2021-05-09 ch11 语言模型

      本文链接:https://www.haomeiwen.com/subject/gkomdltx.html