机器学习中关于样本和预测的几个概念

作者: 郭青耀 | 来源:发表于2017-12-27 19:04 被阅读0次

机器学习中关于样本和预测的几个概念
标签平滑label smooth
损失函数与鲁棒性
NLTK之文本分类
深度学习02-激活函数和成本损失函数
准确率、精确率、召回率
机器学习中的Inductive Bias
1.机器学习的基本概念和词汇
机器学习的发展史
客户分群-聚类算法

先看一个简单的应用场景：

查询的图片编号为：c1,c2,c3,c9,c0
样本库中的编号为：s1,s2,s3,s4,s5,s6,s7,s8,

实际情况对应为:

c1--s1 , c2--s2 , c3--s3

c9和c0 没有对应

通过模型判定的情况是：

情况A ：查c1 ,模型给出 s1 , ----> 能查到的图片，查到了，----> 术语 TP
情况B：查c2 ,模型给出 s7 , ----> 能查到的图片，没查到，----> 术语 FP
情况C ：查c9 ,模型没有输出 ----> 不能查到的图片，没查到 ----> 术语 TN
情况D ：查c0 ,模型给出s8 , ----> 不能查到的图片，查到了-----> 术语 FN

术语的详解 TP/TN/FP/FN （形容样本属性和预测结果的判定）

True Positive (TP): “真正” 指被model预测为正的正样本，即判断为真的正确率
True Negative(TN): “真负” 指被model预测为负的负样本，即判断为假的正确率
False Positive(FP): “假正” 指被模型预测为正的负样本，即误报率
False Negative(FN): “假负” 指被模型预测为负的正样本，即漏报率

理解方式：

Positive/Negative是用来形容样本的
以图片查找为例，能在图片中查找到为 Positive（c1,c2,c3），不能查到到为Negative(c9,c0)
True/False 是用来形容模型发的预测结果的
以图片查找为例：
- 能在图片中查到，通过模型也查到了，为True，情况A
- 不能在图片中查到，通过模型也没有查到，为True ,情况C
- 能在图片中查到，通过模型却没有查到，为False，情况B
- 不能在图片中查到，通过模型却查到了，为False ,情况D

三个衡量指标

精准度（precision）:
P = TP/(TP+FP) 指被分类器判定正例中的正样本的比重。
都是针对正样本，正样本中通过模型判定正确的比例。
在样本中能够查询到图片中，通过模型真的能查询到的比例。

召回率(Recall):
R=TP/(TP+FN) = 1- FN/T 指的是被预测为正例的占总的正例的比重。
通过模型预测为正的结果中，有多少实际为正的比例。

准确率(Accuracy):
A = TP/(TP+FN)=(TP+TN)/(TP+FN+FP+TN) 反映了分类器对整个样本的判定能力。
也就是说能将正的判定为正，负的判定为负占整个样本的比例。

本文同步更新在csdn上： http://blog.csdn.net/StepByStepTo/article/details/78921770

网友评论

本文标题：机器学习中关于样本和预测的几个概念

本文链接：https://www.haomeiwen.com/subject/ntfpgxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

机器学习中关于样本和预测的几个概念

术语的详解 TP/TN/FP/FN （形容样本属性和预测结果的判定）

三个衡量指标

相关文章

机器学习中关于样本和预测的几个概念

标签平滑label smooth

损失函数与鲁棒性

NLTK之文本分类

深度学习02-激活函数和成本损失函数

准确率、精确率、召回率

机器学习中的Inductive Bias

1.机器学习的基本概念和词汇

机器学习的发展史

客户分群-聚类算法

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

机器学习中关于样本和预测的几个概念

术语的详解 TP/TN/FP/FN （形容样本属性 和预测结果的判定 ）

三个衡量指标

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

术语的详解 TP/TN/FP/FN （形容样本属性和预测结果的判定）