## 机器学习评估系统
机器学习(ML),自然语言处理(NLP),信息检索(IR)等领域,评估(Evaluation)是一个必要的工作,而其评价指标往往有如下几点:准确率(Accuracy),精确率(Precision),召回率(Recall)和F1-Measure。
| | 正类(positive) | 负类(negative) |
| :---- | ------------------ | ----------------- |
| True | TP | TN |
| False | FP(Type I Error) | FN(Type II Error) |
精确率(Precision):Precision is the number of document retrieved that are relevant
$$
P=\frac{TP}{TP+FP}
$$
所有被划分为正样本中正确的比例。高精确率意味着分类中垃圾很少。
召回率(recall):Recall is the number of relevant document that are retrieved.
$$
R=\frac{TP}{TP+FN}
$$
所有的正样本中被正确分类所占的比例,高召回率意味着很少有相关的数据被遗漏。
F1-measure :F1值就是精确值和召回率的调和均值
$$
\frac{1}{F1}=\frac{1}{P}+\frac{1}{R}
$$
![](https://github.com/Leeandong/markdown_pictures/raw/master/evaluation-and-credibilitypart-2-43-638.jpg)
[1]https://towardsdatascience.com/model-evaluation-i-precision-and-recall-166ddb257c7b
[2]https://blog.argcv.com/articles/1036.c
网友评论