美文网首页
分类评估

分类评估

作者: SummerTan | 来源:发表于2017-10-24 16:53 被阅读0次

混淆矩阵:

对于二分类的分类问题, 我们可以根据样例将真实类别与预测类别的组合分为真正例(true positive),假正例(false positive),真反例(true negative), 假反例(false negative)四种情形.

根据混淆矩阵可以计算如下指标:

ROC曲线

ROC曲线全称是‘受试者工作曲线’。ROC曲线越远离对角线,模型效果越好。如果要比较两个分类器的性能孰优孰劣,可以比较ROC曲线下的区域面积即为AUC值,AUC值越接近1模型的效果越好。

纵轴:真正例率TPR=TP/(TP+FN),也就是召回率Recall;

横轴:假正例率FPR=FP/(FP+TN)。

PR曲线

PR图反应了分类器在不同阈值下识别正例的准确率和覆盖率之间的权衡。

在一些应用中,对查全率和查准率的重视程度有所不同。推荐系统中,更希望推荐商品是用户感兴趣的,此时查准率更重要;逃犯信息检索中,更希望少漏掉逃犯,查全率更重要,可以通过加权计算F1值来比较性能。

纵轴:查准率Precision=TP/(TP+FP),

横轴:查全率Recall=TP/(TP+FN)。

Lift(提升)曲线

Lift 曲线是不同阈值下Lift和预测正例占比的轨迹。

在使用模型进行预测之后,模型的查准率为precision=TP/(TP+FP),在不使用模型之前,模型的查准率为pre_precision=(TP+FN)/(TP+FP+FN+TN),所以在使用模型之后,模型的查准率提升至Lift值=precision/pre_precision.Lift(提升)曲线衡量的是,与不利用模型相比,模型的预测能力“变好”了多少。lift(提升指数)越大,模型的运行效果越好。一般lift(提升指数)>1.

纵轴:Lift值=precision/pre_precision,

横轴:预测正例占比x=(TP+FP)/(TP+FP+FN+TN)

Gain曲线

Gain增益图是描述整体精准率的指标.和Lift曲线在于纵轴刻度的不同。

纵轴:Gain=precision=TP/(TP+FP),

横轴:预测正例占比x=(TP+FP)/(TP+FP+FN+TN)

代码实现

python版本的ROC代码可以参考这个博客python版ROC代码

Spark版本的差不多,后续更新吧

相关文章

  • 分类评估

    混淆矩阵: 对于二分类的分类问题, 我们可以根据样例将真实类别与预测类别的组合分为真正例(true positiv...

  • 分类模型的评估(三)

    在前两篇文章里(《分类模型的评估(一)》和《分类模型的评估(二)》),针对二分类问题,我们分别讨论了 评估某个给定...

  • python week 15

    分类器评估学习

  • Various classifier comparisons o

    加载数据 分类器 评估

  • 《绩效管理》--绩效指标与标准

    1、什么是绩效评估指标?绩效评估指标有哪些分类? 评估指标指的是评估因子或评估项目。 根据评估内容分:1)工作业绩...

  • 复习 - 模型测试

    一、模型测试的API总结 1、分类算法评估方式 2、回归算法评估方式 二、分类模型测试 交叉验证:(Cross V...

  • 分类模型的评估(二)

    在上一篇文章里(《分类模型的评估(一)》),我们讨论了针对某一给定分类结果的评估指标,也就是查准率(Precisi...

  • 模型性能评估

    不同的机器学习任务对应有不同的评估指标: 评估分类模型 混淆矩阵(Confusion matrix): True ...

  • 分类器评估方法

    使用sklearn.metrics包中的性能度量函数 分类器性能指标 回归器性能指标 聚类器性能指标 两两距离测度...

  • 7.7 分类模型评估

    “所有模型都是坏的,但有些模型是有用的”。建立模型之后,接下来就要去评估模型,以确定此模型是否“有用”。sklea...

网友评论

      本文标题:分类评估

      本文链接:https://www.haomeiwen.com/subject/pjcxpxtx.html