美文网首页
机器学习中关于样本和预测的几个概念

机器学习中关于样本和预测的几个概念

作者: 郭青耀 | 来源:发表于2017-12-27 19:04 被阅读0次

先看一个简单的应用场景:

查询的图片编号为 :c1,c2,c3,c9,c0
样本库中的编号为:s1,s2,s3,s4,s5,s6,s7,s8,

实际情况对应为:

  • c1--s1 , c2--s2 , c3--s3
  • c9和c0 没有对应

通过模型判定的情况是:

情况A : 查c1 ,模型给出 s1 , ----> 能查到的图片,查到了,----> 术语 TP
情况B: 查c2 ,模型给出 s7 , ----> 能查到的图片,没查到,----> 术语 FP
情况C :查c9 ,模型没有输出 ----> 不能查到的图片,没查到 ----> 术语 TN
情况D :查c0 ,模型给出s8 , ----> 不能查到的图片,查到了-----> 术语 FN

术语的详解 TP/TN/FP/FN (形容样本属性 和预测结果的判定 )

  1. True Positive (TP): “真正” 指被model预测为正的正样本,即判断为真的正确率
  2. True Negative(TN): “真负” 指被model预测为负的负样本,即判断为假的正确率
  3. False Positive(FP): “假正” 指被模型预测为正的负样本,即误报率
  4. False Negative(FN): “假负” 指被模型预测为负的正样本,即漏报率

理解方式:

  1. Positive/Negative是用来形容样本的
    以图片查找为例,能在图片中查找到为 Positive(c1,c2,c3) ,不能查到到为Negative(c9,c0)

  2. True/False 是用来形容模型发的预测结果的
    以图片查找为例:

    • 能在图片中查到,通过模型也查到了,为True,情况A
    • 不能在图片中 查到,通过模型也没有查到,为True ,情况C
    • 能在图片中查到,通过模型却没有查到,为False,情况B
    • 不能在图片中查到,通过模型却查到了,为False ,情况D

三个衡量指标

精准度(precision):
P = TP/(TP+FP) 指被分类器判定正例中的正样本的比重。
都是针对正样本,正样本中通过模型判定正确的比例。
在样本中能够查询到图片中,通过模型真的能查询到的比例。

召回率(Recall):
R=TP/(TP+FN) = 1- FN/T 指的是被预测为正例的占总的正例的比重。
通过模型预测为正的结果中,有多少实际为正的比例。

准确率(Accuracy):
A = TP/(TP+FN)=(TP+TN)/(TP+FN+FP+TN) 反映了分类器对整个样本的判定能力。
也就是说能将正的判定为正,负的判定为负占整个样本的比例。

本文同步更新在csdn上: http://blog.csdn.net/StepByStepTo/article/details/78921770

相关文章

  • 机器学习中关于样本和预测的几个概念

    先看一个简单的应用场景: 查询的图片编号为 :c1,c2,c3,c9,c0样本库中的编号为:s1,s2,s3,s4...

  • 标签平滑label smooth

    概念: 机器学习的样本中通常会存在少量错误标签,这些错误标签会影响到预测的效果。标签平滑采用如下思路解决这个问题:...

  • 损失函数与鲁棒性

    损失函数 机器学习模型关于单个样本的预测值与真实值的差称为损失。损失越小,模型越好,如果预测值与真实值相等,就是没...

  • NLTK之文本分类

    机器学习 1 监督式学习 分类算法 预测测试样本是否属于某些类型中的一个回归算法 主要用于预测某种连续性的变量...

  • 深度学习02-激活函数和成本损失函数

    损失函数: 机器学习中单个样本的预测值与真实值的差称为损失,失越小,模型越好,如果预测值与真实值相等,就是没有损失...

  • 准确率、精确率、召回率

    1、可以是关于预测 2、准确率:预测为正样本个数/总样本预测数 精确率:将正样本预测为正样本个数/预测为正样...

  • 机器学习中的Inductive Bias

    机器学习算法中,假设学习器在预测中逼近正确的结果,其中包括在训练中未出现的样本。既然是未知的状况,结果可以是任意的...

  • 1.机器学习的基本概念和词汇

    机器学习词汇 目标:预测类别或数据值(要预测的列) 特征:用于预测的数据属性(非目标列) 样本:数据内的单个数据点...

  • 机器学习的发展史

    关于机器学习的详细内容:机器学习入门:概念原理及常用算法 (本课程主要讲解机器学习的概念、原理和应用场景,以及机器...

  • 客户分群-聚类算法

    机器学习算法分类 有监督学习 有训练样本 分类模型 预测模型 无监督学习 无训练样本 关联模型 聚类模型 聚类算法...

网友评论

      本文标题:机器学习中关于样本和预测的几个概念

      本文链接:https://www.haomeiwen.com/subject/ntfpgxtx.html