Ngram ppl 计算说明

Ngram ppl 计算说明

作者: 期望最大化 | 来源:发表于2019-01-07 12:07 被阅读26次

Ngram ppl 计算说明
Ngram discount计算
二十四、Elasticsearch通过ngram分词机制实现搜索
PPL-并行模式库
2019-01-15000
简单的记一下mysql-full-text
24_深度探秘搜索技术_实战通过ngram分词机制实现index
我们很爱你，上帝也是
NGram prune
工具 | 使用Google Ngram Viewer

语言模型可以用于知道前 $N-1$ 个词的情况下，预测第 $N$ 个词的概率。
Perplexity(PPL) 用来衡量语言模型的好坏，越小越好。其物理意义可以近似理解为：有了语言模型后，预测的第 $N$ 个词的可能性大小，比如ppl=76，可以近似理解为，知道了前 $N-1$ 个词，第 $N$ 个词平均情况下的可能性大小为76，如果没有语言模型，这个可能性为词典大小 $V$ ，ppl具体计算公式如下:

$ppl = p(S)^{-\frac{1}{N}}$ $p(S)$ 通常得到的是log值，转换后如下
$ppl = 10^{-\frac{1}{N} logp(S)}$
$N$ : 句子中词的个数。ppl计算中包括</s>，ppl1中计算不包括</s>，所有N要少1，ppl1比ppl要大不少

示例如下：

ppl.png

ppl = 10^{-\frac{1}{N} logp(S)} = 10 ^{-\frac{1}{14+1} * (-33.6968)} = 10^{2.2464} = 176.382

ppl1 = 10^{-\frac{1}{N} logp(S)} = 10 ^{-\frac{1}{14} * (-33.6968)} = 10^{2.4069} = 255.221

Ngram工具srilm中：

底数选用都是10，而不是自然对数 $e$ ，句子概率计算以及ppl计算的时候都是10。同样的，语音识别中和声学模型得分进行插值的时候需要做个转换。
句子得分 $p(S)$ 计算的时候，需要在前后加上<s>、<\s>，p(<s>)概率为1，log值为0，因为第一个词默认都是<s>。
语音识别得分计算中包括am cost、graph cost，其中graph cost = lm score + dict score + hmm score。前两者分别是由G.fst和L.fst提供，构图后的HCLG.fst中就包括这两部分，hmm score 跳转是hmm state跳转部分，也就是Ha.fst部分。

相关文章

Ngram ppl 计算说明
语言模型可以用于知道前个词的情况下，预测第个词的概率。Perplexity(PPL) 用来衡量语言模型的好坏，越小...
Ngram discount计算
参考 http://www.speech.sri.com/projects/srilm/manpages/ngra...
二十四、Elasticsearch通过ngram分词机制实现搜索
1、什么是ngram 例如英语单词 quick，5种长度下的ngram 2、什么是edge ngram quick...
PPL-并行模式库
PPL简介并行模式库 (PPL) 提供命令式编程模型，以促进开发并发应用程序的可扩展性和易用性。 PPL 构建在...
2019-01-15000
Ppl L0
简单的记一下mysql-full-text
1、首先要设置 ngram_token_size 一种是在启动mysql的时候 mysqId --ngram_...
24_深度探秘搜索技术_实战通过ngram分词机制实现index
24_深度探秘搜索技术_实战通过ngram分词机制实现index-time搜索推荐 1、ngram和index-t...
我们很爱你，上帝也是
Artists are ppl compelled to bring beautiful into a world...
NGram prune
Reference https://blog.csdn.net/xmdxcsj/article/details/5...
工具 | 使用Google Ngram Viewer
一、介绍 Google Books Ngram https://books.google.com/ngrams ...

网友评论

本文标题：Ngram ppl 计算说明

本文链接：https://www.haomeiwen.com/subject/mhzyrqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Ngram ppl 计算说明|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！