https://developers.google.cn/machine-learning/crash-course/classification/thresholding
阈值
为了将逻辑回归值映射到二元类别,必须指定分类阈值(也称为判定阈值)。
真与假以及正类别与负类别
![](https://img.haomeiwen.com/i7056140/f29752abf475f29b.gif)
真正例:是指模型将正类别样本正确地预测为正类别。
真负例:是指模型将负类别样本正确地预测为负类别。
假正例:是指模型将负类别样本错误地预测为正类别。
假负例:是指模型将正类别样本错误地预测为负类别。
准确率 accuracy
![](https://img.haomeiwen.com/i7056140/30541864f2ef4275.jpg)
![](https://img.haomeiwen.com/i7056140/9f7acee063b3181d.jpg)
精确率 precision
![](https://img.haomeiwen.com/i7056140/13da1b74b15bad48.jpg)
召回率recall
![](https://img.haomeiwen.com/i7056140/d96c6a30708689e6.jpg)
准确率就是找得对,召回率就是找得全
召回率也叫查全率,准确率也叫查准率
要全面评估模型的有效性,必须同时检查精确率和召回率。遗憾的是,精确率和召回率往往是此消彼长的情况。
F1值是精确值和召回率的调和均值
ROC 曲线
(接收者操作特征曲线 receiver operating characteristic curve)
一种显示分类模型在所有分类阈值下的效果的图表。
1-特异度(%) 敏感度(%)
![](https://img.haomeiwen.com/i7056140/ee49485e96e54e22.jpg)
曲线下面积
表示“ROC 曲线下面积” - AUC Area under curve
![](https://img.haomeiwen.com/i7056140/87de0f3020b214d7.jpg)
将某个 随机正类别样本 排列在 某个随机负类别样本 之上的概率
预测偏差
![](https://img.haomeiwen.com/i7056140/cdf09f07a3d4427a.jpg)
![](https://img.haomeiwen.com/i7056140/9b8521fe847451bd.jpg)
网友评论