在训练好模型后做predict时,需要有一系列评价指标,以下是常用的几个:
true positives (纳真,真阳性)
false positives(纳伪,假阳性)
false negatives(去真,假阴性)检测为negative实际为positive
true negatives (去伪,真阴性)
Recall(召回率):所有正确的信息或者相关的信息(wanted)被检测出来的比例;
Precision(准确率):被检测出来的信息当中 正确的或者相关的(也就是你想要的)信息中所占的比例;
F1-Meature(综合评价指标)
在实际当中我们当然希望检索的结果P越高越好,R也越高越好;事实上这两者在某些情况下是矛盾的。比如,我们只搜出了一个结果,且是准确的,那么P就是100%,但是R就很低;而如果我们把所有结果都返回,那么必然R是100%,但是P很低。因此在不同的场合中需要自己判断希望P比较高还是R比较高。如果是做实验,可以绘制Precision-Recall曲线来帮助分析。
参考:http://blog.csdn.net/t710smgtwoshima/article/details/8215037
网友评论