开篇记录面试第二天

作者: 一路不向西 | 来源:发表于2019-05-27 23:24 被阅读0次

今天学习了几个概念,f1-score,ROC,AUC

f1-score

f1-score

TP:预测为正,实际为正;

FP:预测为正,实际为负样本;

TN:预测为负,实际为正;

FN:预测为负,实际为负。

后面那个字母说明的是预测的为哪个类。

进一步,我们可以定义 recall ,precision, F1-score 如下所示:

Accuracy=\frac{TP+TN}{TP+TN+FP+FN}

Recall=\frac{TP}{TP+FP}

Precision=\frac{TP}{TP+FN}

f1-srcoe=\frac{2*TP}{2*TP+FN+FP}=\frac{2*Precision*Recall}{Precision+Recall}

可以看到,recall 体现了分类模型HH对正样本的识别能力,recall 越高,说明模型对正样本的识别能力越强,precision 体现了模型对负样本的区分能力,precision越高,说明模型对负样本的区分能力越强。F1-score 是两者的综合。F1-score 越高,说明分类模型越稳健。

比如我们常见的雷达预警系统,我们需要对雷达信号进行分析,判断这个信号是飞行器(正样本)还是噪声 (负样本), 很显然,我们希望系统既能准确的捕捉到飞行器信号,也可以有效地区分噪声信号。所以就要同时权衡recall 和 precision这两个指标,如果我们把所有信号都判断为飞行器,那 recall 可以达到1,但是precision将会变得很低(假设两种信号的样本数接近),可能就在 0.5 左右,那F1-score 也不会很高。

有的时候,我们对recall 与 precision 赋予不同的权重,表示对分类模型的偏好:

F_\beta=\frac{(1+\beta^2)TP}{(1+\beta^2)TP+\beta^2FN+FP}

ROC

PR曲线
横坐标为假阳性率,纵坐标为真阳性率。
假阳性率等于FP除以N,FP是错分为正样本的数量,N为真实的负样本数;
真阳性率等于TP除以P,TP是正确分类为正样本的数量,P为真实的正样本数。

AUC

AUC指的是ROC曲线下的面积大小,该值能够量化的反映基于ROC曲线衡量出的模型性能。计算AUC值只需要沿着ROC的横轴做积分就可以了。由于ROC曲线一般在y=x上方(如果在下面,那只需要将预测概率改为1-p就可以得到一个更好的分类器),所以AUC的值一般为0.5-1.

相关文章

  • 开篇记录面试第二天

    今天学习了几个概念,f1-score,ROC,AUC f1-score f1-score TP:预测为正,实际为正...

  • 开篇记录面试第69天

    这次换工作战线确实拉的太长了,连我自己都快不记得最开始的面试是什么状态了。上周五面了瓜子的终面,缺在基础知识不够了...

  • 开篇记录面试第28天

    今天早上早起去面试了易道博识,结果因为昨晚跑步,睡得晚,早上差点起不来。 正题。记录下今天面试几个没有答出来的问题...

  • 开篇记录面试第57天

    真的没想到这次找工作会经历这么长的时间,不过感觉最近公司的活动频繁一些了,开始有比较多的公司在接触了,所以现在要打...

  • 开篇记录面试第17天

    说真的,早上收到了一个准offer的电话,感觉心态一下子就轻松了很多。当然,我知道那并不是我本意,我要做的还有很多...

  • 开篇记录面试第56天

    中间经历了一段时间的思想斗争,发现自己还是想换个环境的,毕竟在这边已经显然拿不到年终奖了,晋升也没什么希望,所以还...

  • 开篇记录面试第14天

    时间过得好快,不知不觉已经是开篇记录的第14天了,至今没有offer。正式面试也有三个周了,面试问题倒是积累了不少...

  • 开篇记录面试第15天

    今天眼睛特别不舒服,也不知道是压力太大还是怎么了,以前也没这么多毛病啊,怎么看几道算法题就开始这也不舒服,那也不舒...

  • 开篇记录面试第19天

    今天下午请假去面试了陌陌,记录了几道题目: 二叉树的蛇形遍历,就是第一层从左到右,第二层从右到左,第三层从左到右,...

  • 开篇记录面试第33天

    我真的是已经要把北京的工作都错过了,今天面试头条又挂了,深深地绝望,已经完全不知道该超哪个方向努力了。反正现在公司...

网友评论

    本文标题:开篇记录面试第二天

    本文链接:https://www.haomeiwen.com/subject/jirltctx.html