混淆矩阵、准确率、精确率、召回率、F值、ROC曲线、AUC、PR

作者: 小歪与大白兔 | 来源:发表于2018-08-10 13:20 被阅读302次

看完理解ROC与AUC
分类问题评价标准及Python实现
指标
混淆矩阵、准确率、精确率、召回率、F值、ROC曲线、AUC、PR
机器学习分类问题评估指标（准确率、召回率、F1 ，P-R 曲线，
机器学习中的常用评价指标汇总
模型评估指标
Python数据分析学习笔记（四）：模型评估
面试题目总结-机器学习算法—评价指标
PR曲线和F1、ROC曲线和AUC

TPR FPR
- 样本中的真实正例类别总数即TP+FN
  TPR即True Positive Rate，TPR = TP/(TP+FN)。
- TPR：真实的正例0中，被预测为正例的比例
- 样本中的真实反例类别总数为FP+TN
  FPR即False Positive Rate，FPR=FP/(TN+FP)。
- FPR：真实的反例1中，被预测为正例的比例
- 理想分类器TPR=1，FPR=0
截断点thresholds
机器学习算法对test样本进行预测后，可以输出各test样本对某个类别的相似度概率。比如t1是P类别的概率为0.3，一般我们认为概率低于0.5，t1就属于类别N。这里的0.5，就是”截断点”。

总结一下，对于计算ROC，最重要的三个概念就是TPR, FPR, 截断点。

ROC曲线
ROC曲线越接近左上角，代表模型越好，即ACU接近1

from sklearn.metrics import roc_auc_score, auc
import matplotlib.pyplot as plt
y_predict = model.predict(x_test)
y_probs = model.predict_proba(x_test) #模型的预测得分
fpr, tpr, thresholds = metrics.roc_curve(y_test,y_probs)
roc_auc = auc(fpr, tpr)  #auc为Roc曲线下的面积
#开始画ROC曲线
plt.plot(fpr, tpr, 'b',label='AUC = %0.2f'% roc_auc)
plt.legend(loc='lower right')
plt.plot([0,1],[0,1],'r--')
plt.xlim([-0.1,1.1])
plt.ylim([-0.1,1.1])
plt.xlabel('False Positive Rate') #横坐标是fpr
plt.ylabel('True Positive Rate')  #纵坐标是tpr
plt.title('Receiver operating characteristic example')
plt.show()

运行结果如下图所示：

参考资料：
1.混淆矩阵(Confusion Matrix)
https://www.jianshu.com/p/0fc8a0b784f1
2.ROC与AUC的定义与使用详解
https://blog.csdn.net/shenxiaoming77/article/details/72627882

看完理解ROC与AUC
混淆矩阵、AUC、ROC，傻傻分不清楚？来看这篇就对了 - 知乎对准确率、精确率、召回率、AUC、ROC的理解 ...
分类问题评价标准及Python实现
分类问题常见的标准：准确率，精确率，召回率，F1-Score， AUC, ROC曲线, P-R曲线一、定义分类...
指标
准确率精确率召回率 ROC&AUC
混淆矩阵、准确率、精确率、召回率、F值、ROC曲线、AUC、PR
目录混淆矩阵 confusion-matrix 分类准确率 accuracy 精确率Precision 召回率 ...
机器学习分类问题评估指标（准确率、召回率、F1 ，P-R 曲线，
本文主要介绍二分类场景下的评估指标，包括准确率、召回率、F1 ，P-R 曲线，ROC 曲线和 AUC。一、混淆...
机器学习中的常用评价指标汇总
机器学习中的评价指标简要介绍精度、精确率、召回率、P-R曲线、F1 值、TPR、FPR、ROC、AUC等指标，还...
模型评估指标
混淆矩阵、精确率、召回率，ROC、AUC 对于二分类问题来说，所有的问题被分为0和1两类，混淆矩阵是2*2的矩阵：...
Python数据分析学习笔记（四）：模型评估
各种评估指标，混淆矩阵，准确率，召回率，f1值 import numpy as npimport pandas a...
面试题目总结-机器学习算法—评价指标
准确率，精确率，召回率和F1 准确率(Accuracy), 精确率(Precision), 召回率(Recall)...
PR曲线和F1、ROC曲线和AUC
PR曲线和F1、ROC曲线和AUC ROC曲线越靠近左上角的位置模型效果越好（高真阳性率，低假阳性率），ROC曲线...