美文网首页
分类器的评判指标(一)

分类器的评判指标(一)

作者: BUCJ | 来源:发表于2017-06-23 11:47 被阅读0次

问题导入:建立好了一个分类器,如何知道这个分类器是好是坏了?

今天我们说一下常用的分类器评判指标

对于二分类问题而言,其中的P,R分别表示Precision(查准率)和Recall(查全率),上面的TP,TN,FP,FN可以通过下面的混淆矩阵得到

查准率表征的是:在所有预测为正例的样本中,有多少比例的样本预测正确

查全率表征的是:在所有为正例的样本中,有多少比例的样本被正确找到

在现实应用中,差准率和查全率一般是相互排斥的,很难保证Precision和Recall同时增加。

举一个极端的例子:你现在一共有10个西瓜,里面有5个好瓜和5个坏瓜,你从中拿出一个瓜,并成功预测其为好瓜,那么这时查准率为1,但是查全率为1/5 = 0.2,当你增加拿出的瓜的数量,假如现在你把10个瓜都拿出来了,并都预测其为好瓜,那么这个时候查准率为5/10=0.5,但是查全率为1。在实际应用中,有些应用会比较偏重查准率,有些应用比较偏重查全率。引用周志华老师的一个例子:在肿瘤诊断中,我们希望是尽可能的查准,这里查准率比查全率要更重要些,试想一下,若更偏重查全率,抱着“宁错杀一千,不放过一人”的态度,把没有得肿瘤的人也诊断为肿瘤患者,这会造成很大的负面影响;而在罪犯抓捕应用中,则会更看重查全率,若看重查准率的话,则会错失很多抓捕罪犯的机会。

在上式中的Fbeta,beta表征的是:查全率相对查准率的重要性。若beta>1,则更偏重查全率;若beta<1,则更偏重查准率。

相关文章

  • 分类器的评判指标(一)

    问题导入:建立好了一个分类器,如何知道这个分类器是好是坏了? 今天我们说一下常用的分类器评判指标 对于二分类问题而...

  • 数据挖掘

    预测指标 分类常见的评估指标:对于二类分类器/分类算法,评价指标主要有accuracy, [Precision,R...

  • 使用pytorch计算分类模型的混淆矩阵

    1.概念 混淆矩阵是评判模型结果的一种指标,属于模型评估的一部分,常用于评判分类器模型的优劣。一个例子: 横坐标:...

  • 分类器指标

    二值分类器指标: precision,recall,F-score[^1],以及我们今天要讨论的ROC和AUC R...

  • 分类器评估方法

    使用sklearn.metrics包中的性能度量函数 分类器性能指标 回归器性能指标 聚类器性能指标 两两距离测度...

  • 统计学习方法(二)评价指标

    1 准确率 评价分类器性能的指标一般是分类准确率(accuracy),其定义是:对于给定的测试数据集,分类器正确分...

  • 机器学习day4

    ROC曲线 二值分类器是机器学习中最常见的分类器。评价的指标也有很多,precision,recall,F1 sc...

  • 理解分类器的指标,指标设计与权衡

    一、单个分类器指标评价 P = TP + FN 正样本总数 N = FP + TN 负样本总数 FPR = FP/...

  • 链路预测

    2.4评价指标 2.4.1AUC ROC曲线下的面积。信号探测理论中,ROC曲线用来评价某种分类器的分类效果。这种...

  • ROC vs. PRC

    前言 评价二元分类器性能的指标,常见的有:Accuracy,ROC curve(Sensitivity + Sp...

网友评论

      本文标题:分类器的评判指标(一)

      本文链接:https://www.haomeiwen.com/subject/ukzqcxtx.html