2018-07-17 ROC和AUC

作者: cogear | 来源:发表于2018-07-17 00:28 被阅读0次

前言

即使是二分分类任务,多数机器学习模型也并非输出0或1这样的整数,而是产生一个概率值(一般在0-1之间)。然后设置一个分类阈值(threshold),当概率值大于threshold,判作正例。否则,为反例。
另一种直观的方法是,根据这个产生的概率值,从大到小将样本排序。从中选择一点为截断点(cut point),截断点以上判作正例,截断点以下判作反例。
这个截断点的设置也有不同的策略,当更看重Precision查准率时,可以将截断点选在靠前靠上的位置。当更看重Recall时,就将截断点设置在靠后的位置。
排序质量的好坏(其实就是模型预测的概率值的好坏),将影响“期望泛化性能”的好坏。

ROC

ROC全称是“受试者工作特征”(Receiver Operating Characteristic)曲线。ROC曲线的横轴是真正例率(True Positive Rate,TPR),纵轴是假正例率(False Positive Rate,FPR)。
两者的定义为:
TPR=\frac{TP}{TP+FN}
FPR=\frac{FP}{TN+FP}
可以看出,TP+FP为截断点以上的样本。当然,我们希望TPR越大,同时FPR越小。即坐标轴的左上角(1,0)位置为理想模型。
PS:把截断点从排序的样本序列0位置开始,一直到最后,每个位置求出TPR和FPR,得到坐标点,可画出ROC曲线

AUC

AUC是指ROC曲线以下的面积,即Area Under ROC Curve。

相关文章

  • 房屋信贷违约风险竞争(kaggle)系列2-数据清理和格式化

    一. ROC和AUC ROC(受试者工作特征曲线)AUC(ROC曲线下的面积) 在诸如逻辑回归或者神经网络的分类器...

  • sklearn notes

    Difference between roc_auc_score() and auc() AUC is not a...

  • 2018-07-17 ROC和AUC

    前言 即使是二分分类任务,多数机器学习模型也并非输出0或1这样的整数,而是产生一个概率值(一般在0-1之间)。然后...

  • 《机器学习》第二章

    知识整理 ROC和AUC ROC的画法:参考CSDN。 AUC的意义:从Positive中选一个例子P,从Nege...

  • AUC面试

    目录 混淆矩阵 ROC曲线 AUC定义 AUC计算 AUC 优点和缺点 AUC的python实现代码 1. 混淆矩...

  • ROC和AUC

    前言 ROC(Receiver Operating Characteristic)曲线和AUC常被用来评价一个二值...

  • AUC和ROC

    AUC(只能用于二分类) AUC值是一个概率值,当你随机挑选一个正样本以及一个负样本,当前的分类算法根据计算得到的...

  • auc和roc

    ROC曲线下面的面积就是AUC的值,介于0.1和1之间。Auc作为数值可以直观的评价分类器的好坏,值越大越好。 a...

  • AUC和ROC

    AUC :曲线下面积(Area Under the Curve) AUROC :接受者操作特征曲线下面积(Area...

  • 【实战篇】集成算法建模(二)

    连载的上一篇文章,小鱼和大家一起学习了 ROC 曲线和 AUC 面积:AUC 被定义为 ROC 曲线下方的面积,A...

网友评论

    本文标题:2018-07-17 ROC和AUC

    本文链接:https://www.haomeiwen.com/subject/epiipftx.html