美文网首页
机器学习的分类性能指标

机器学习的分类性能指标

作者: H14ugust | 来源:发表于2018-03-26 15:47 被阅读0次

最近处理一个从3维MRI图像中分割海马体的任务,发现使用acc来衡量网络的性能实在是没什么意义,主要是我把这个分割任务看做一个二分类任务,而属于海马体类的像素仅占了整个空间的0.03%,也就意味着class 1 仅占1%都不到,这可以说是一个相当不均衡的数据集了,所以使用acc来衡量分类器是毫无意义的。
所以搜索整理了一些网上的资料,学习了一些适于处理这些情况(不均衡二分类)的性能指标:

混淆矩阵 confusion matrix

又称为可能性表格或是错误矩阵。它是一种特定的矩阵,被用来实现算法性能的可视化。


image

盗来一张图
真阳性(True Positives):预测为1,实际为1
假阳性(False Positives):预测为1,实际为0
真阴性(True Negatives) :预测为0,实际为0
假阴性(False Negatives) :预测为0,实际为1
于是乎就有了

精确率
precision=TP/(TP+FP)
召回率
recall = TP/(TP+FN)
F1分数
F-score=2 × precison × recall/(precision+recall)

F1是前两者的调和均值,当然我很奇怪我什么在Keras里它会一直是NAN,前两个的计算都没问题。

ROC曲线

有两个新的概念

灵敏度
sensitivity=recall
特异度
specificity = TN/(FP+TN)
此外灵敏度又被称为真阳性率(TPR),特异度又被称为真阴性率(TNR)

ROC曲线以1-specificity为横坐标,sensitivity为纵坐标。
又盗一张图



图二的曲线越接近(0,1)说明性能越好

AUC

AUC指ROC曲线下的面积,面积越大分类器效果越好。
AUC的物理意义为,随机给定一个正样本,一个负样本,使用分类器进行预测,设判断正样本为正的概率为P1,判断负样本为正的概率为P2,P1>P2的概率就是AUC值。
AUC的取值区间为[0.5 , 1],为0.5表明AUC猜错与猜对的几率对半分,即完全随机的预测,1则代表完美分类器。

相关文章

  • 机器学习的分类性能指标

    最近处理一个从3维MRI图像中分割海马体的任务,发现使用acc来衡量网络的性能实在是没什么意义,主要是我把这个分割...

  • 4.分类算法(scikit-learn 的 perceptron

    应用机器学习分类算法的五个步骤 选择特征 选择一个性能指标 选择一个分类器和一个优化算法 评价模型的性能 优化算法...

  • 机器学习的度量指标

    在机器学习中,性能指标(Metrics)是衡量一个模型好坏的关键,性能指标根据问题不同,主要分为:回归类性能指标和...

  • 机器学习基础概念

    一、什么是机器学习? 简单来说,机器学习是机器通过观察数据积累经验来获取技能(改进一些性能指标)的过程。 二、机器...

  • Coursera台大机器学习基础课程学习笔记2 -- 机器学习的

    Coursera台大机器学习基础课程学习笔记2 -- 机器学习的分类 总体思路: 各种类型的机器学习分类 按照输出...

  • 08-KNN

    一.机器学习原理 原理机器学习原理.png 常见名词 训练数据类 二.机器学习分类 2.1 有监督学习 分类 K近...

  • 机器学习基础算法(1)-KNN

    KNN (最近邻分类规则)--最简单的机器学习 分类,回归算法 个人认为机器学习的三个最主要的特性,是 分类,回归...

  • 机器学习 -- 绪论(四)机器学习的相关基础概念

    4 机器学习的相关基础概念 4.1 基本术语 4.2 机器学习的任务 4.3 机器学习分类 4.4 监督...

  • Task3 基于机器学习的文本分类

    基于机器学习的文本分类 在本章我们将开始使用机器学习模型来解决文本分类。机器学习发展比较广,且包括多个分支,本章侧...

  • 神经网络:什么是深度学习

    深度学习说白了就是机器学习中的神经网络。 相关知识:分类、回归 分类和回归是机器学习中两个非常重要的问题。 在分类...

网友评论

      本文标题:机器学习的分类性能指标

      本文链接:https://www.haomeiwen.com/subject/pklrcftx.html