美文网首页
混淆矩阵

混淆矩阵

作者: echolvan | 来源:发表于2019-12-25 15:26 被阅读0次

    类偏斜(skewed classes)情况表现为我们的训练集中有非常多的同一种类的实例,只有很少或没有其他类的实例。
    这里我一信贷还款预测为例,不还款的人是少数类有5%,还款为多数类有95%。这种样本倾斜的情况,我们使用准确率来评定模型的好坏是绝对不行的。因为我们判别所有的用户都是还款用户,这样我们的准确率还有95%,而对我们而言要捕捉的少数类不还款的用户我们全都错过了。这样的衡量标准不适合。我们应该要尽可能的捕捉少数类,即使损失一些多数类。
    那这样precision查准率就非常重要了。在这里我们首先介绍一下混淆矩阵。


    混淆矩阵

    关键点
    TN: 样本真实为负样本,预测表示是负样本
    TP: 样本真实为正样本,预测表示是正样本
    FP: 样本真实为负样本,预测表示是正样本
    FN:样本真实为正样本,预测表示是负样本

    假负率:FN/(TN+FN)
    假正率:FP/(TP+FP)
    召回率/查全率:TP/ (TP+FN)
    准确率:(TP+TN)/(TN+TP+FN+FP)正确分类数/样本总数,描述了分类器总体分类准确程度。
    查准率=TP/(TP+FP)预测正样本中,实际上正样本的百分比

    相关文章

      网友评论

          本文标题:混淆矩阵

          本文链接:https://www.haomeiwen.com/subject/pjscoctx.html