美文网首页
NLP Language Model

NLP Language Model

作者: myxz | 来源:发表于2020-03-01 11:58 被阅读0次

语言模型目标

image.png

马尔科夫假设

image.png

注意这里的计算公式


image.png

分完词后的每个词汇作为一个基本单元计算


image.png

评估语言模型

相当于在测试集上跑一遍,比较两个模型的perplexity(复杂度)谁更小。


image.png

平滑

  • 加一平滑 注意V是词典的大小(语料去重后的大小)


    image.png

    解释了分母为什么加V,保证每个条件概率之和为1


    image.png
  • 加K平滑,利用验证集上perplexity判断最优的K


    image.png

Interpolation

下面的例子中in the kitchen的可能性更大,但是仅依靠Trigram无法判断其与in the arboretum的概率。


image.png

所以我们考虑下面的加权平均


image.png

相关文章

网友评论

      本文标题:NLP Language Model

      本文链接:https://www.haomeiwen.com/subject/nlcxkhtx.html