美文网首页自然语言处理—学习日读笔记
数学之美-第三章-统计语言模型

数学之美-第三章-统计语言模型

作者: 无良笔记 | 来源:发表于2017-04-20 07:21 被阅读24次

    文章介绍了什么是统计模型,统计模型的如何得来。
    特别是马尔可夫假设。
    然后就是一个扩展阅读:关于统计语言模型的工程诀窍

    • 高阶语言模型的获得:主要是二元和三元,而之后的四元及其以上的效果提升不明显
    • 关于模型的训练,零概率问题和平滑方法。正好这段时也正在写关于一元(就是昨天才写完)的模型训练和平滑问题的解决,但是我用的模型是贝叶斯模型训练的分类器。虽然我接触的那本书和这本的平滑理论原理是一样的,但是关于他的计算公式那些我还是一知半解的,可能是数学基本功太差了的原因,希望自己后面补一补。
    • 最后就是关于语料库的选择,这个不用多提,很重要,就像一个人初入门的工作者和行业领域专家一个道理。问题需要有针对性才能有更好的解决办法
      什么是统计模型很容易理解,当时关于如何构建模型学问很大,不急慢慢来,一个一个的来。

    相关文章

      网友评论

        本文标题:数学之美-第三章-统计语言模型

        本文链接:https://www.haomeiwen.com/subject/lwekzttx.html