准确率与召回率（Precision & Recall）理解

作者: 吉他小文 | 来源:发表于2016-05-02 18:22 被阅读0次

面试题目总结-机器学习算法—评价指标
Precision & Recall
推荐系统评测指标—准确率(Precision)、召回率(Reca
144.如何评价个性化推荐系统的效果-1
深入浅出之召回率、准确率与F度量
如何评测CRF++结果?——以LOCATION为例
AP，Precision，Recall, mAP 之间的关系
准确率(Precision)、召回率(Recall)、F值(F-
推荐系统评测指标—准确率(Precision)、召回率(Reca
推荐中的概念

我们先看下面这张图来加深对概念的理解，然后再具体分析。其中，我们用P代表Precision，R代表Recall：

pre_recall.png

通俗地来说，Precision 就是检索出来的条目中（比如：文档、网页等）有多少是准确的，Recall就是所有准确的条目有多少被检索出来了。

下面这张表介绍了True Positive，False Negative等常见的概念，P和R也往往和它们联系起来。

	Relevant	NonRelevant
Retrieved	true positives（tp）	false positives（fp）
Not Retrieved	false negatives（fn）	true negatives（tn）

那么，
![][01]
[01]: http://latex.codecogs.com/svg.latex?P=\frac{tp}{tp+fp}\hfill(1)

![][02]
[02]: http://latex.codecogs.com/svg.latex?R=\frac{tp}{tp+fn}\hfill(2)

我们当然希望检索的结果P越高越好，R也越高越好，但事实上这两者在某些情况下是矛盾的。比如极端情况下，我们只搜出了一个结果，且是准确的，那么P就是100%，但是R就很低（tp==1,fp==0,fn很大,tn==0）；而如果我们把所有结果都返回（全部都检索到了，不过检索到不相关的也有很多，即fp很大,fn==0），那么必然R是100%，但是P很低。

因此在不同的场合中需要自己判断希望P比较高还是R比较高。如果是做实验研究，可以绘制Precision-Recall曲线来帮助分析。