分类指标之p值，r值，F1值，微平均和宏平均

作者: ltochange | 来源:发表于2021-07-05 16:37 被阅读0次

分类指标之p值，r值，F1值，微平均和宏平均
ROC曲线，AUC，和P-R曲线的关系
指标、性能
7.8 回归模型评估与交叉验证
机器学习中的常用评价指标汇总
145.如何评价个性化推荐系统的效果-2
精确率、召回率和F1
R语言入门笔记(2) - R语言科学计算
统计学基础2018-05-20
NSArray 快速求最值

假设有12个样本可被分为A，B, C 三个类别，某个分类器的结果如下：

真实	预测
A	B
A	A
A	A
A	C
B	B
B	B
B	A
B	C
C	C
C	C
C	A
C	C

对于多分类来说，P值，R值，F1值都是针对某个类别来说的。对于A类来说，A类就是正类，其他类别都是负类。

A类的混淆矩阵：

	预测为正类	预测为负类
实际为正类	2 （TP）	2 （FN）
实际为负类	2 （FP）	6 （TN）

B类的混淆矩阵：

	预测为正类	预测为负类
实际为正类	2 （TP）	2 （FN）
实际为负类	1 （FP）	5 （TN）

C类的混淆矩阵：

	预测为正类	预测为负类
实际为正类	3 （TP）	1 （FN）
实际为负类	2 （FP）	6 （TN）

P值

precision 精确率

预测为A类的样本中，实际是A类的样本占比:
$P_{A}=\frac {TP} {TP+FP}=\frac 1 2$

预测为B类的样本中，实际是B类的样本占比:
$P_{B}=\frac 2 3$

预测为C类的样本中，实际是C类的样本占比:
$P_{C}=\frac 3 5$

R值

recall 召回率

实际为A类的样本中，被预测为A类的占比:
$R_{A}=\frac {TP} {TP+FN}=\frac 1 2$

实际为B类的样本中，被预测为B类的占比:
$R_{B}=\frac 1 2$

实际为C类的样本中，被预测为C类的占比:
$R_{C}=\frac 3 4$

F1值

F1值是P值和R值得调和平均数：
$\frac 2 F_{1}=\frac 1 P + \frac 1 R$

$F_{1}=\frac{2*P*R} {P+R}$

$F_{A}=2*\frac {\frac 1 2*\frac 1 2} {\frac 1 2+\frac 1 2}=0.5$
$F_{B}=2*\frac {\frac 2 3 *\frac 1 2} {\frac 2 3 +\frac 1 2}=0.571$
$F_{C}=2*\frac {\frac 3 5 *\frac 3 4} {\frac 3 5 +\frac 3 4}=0.667$

这里做一下延伸，F1值计算将P值和R值看得同等重要。若当更关注某一个指标时，公式需要稍作修改：

$F_\beta=\frac{(1+\beta^2)*P*R} {\beta^2*P+R}$

当 $\beta=1$ 时，即是计算 $F_{1}$ 的值。 $\beta<1$ 时, 更关注P值， $\beta>1$ 时, 更关注R值.

在语法纠错中，一般更关注P值，用F0.5。被分类为错误的类别里面，实际错误的比率要足够高，误判会让人感觉很不好。

$F_\beta=\frac{(1+0.5^2)*P*R} {0.5^2*P+R}$

Micro-F1

不区分类别。使用总体的P值和R值计算出Micro-F1

P: 预测为ABC类里面真正正确的占比
R: 实际为ABC类里面真正正确的占比

$P=R=F1=\frac 7 {12}=0.583$

Macro-F1

宏平均有两种计算方式:

直接对每个类别的F1值求平均
$\text{Macro-F1(type1)}=\frac 1 C \sum_{i=1}^{C}F_{i}$
对每一个类别的P值，R值求平均，再计算F1值
$\text{Macro-P}=\frac 1 C \sum_{i=1}^{C}P_{i}$
$\text{Macro-R}=\frac 1 C \sum_{i=1}^{C}R_{i}$
$\text{Macro-F1(type2)}=\frac {2*\text{Macro-P}*\text{Macro-R}} {\text{Macro-P}+\text{Macro-R}}$

sklearn计算的是第一种。

代码验证：

from sklearn.metrics import classification_report
from sklearn.metrics import f1_score

print(classification_report(y_true=["A", "A", "A", "A", "B", "B", "B", "B", "C", "C", "C", "C"],
                            y_pred=["B", "A", "A", "C", "B", "B", "A", "C", "C", "C", "A", "C"],
                            labels=["A", "B", "C"]))

print(f1_score(y_true=["A", "A", "A", "A", "B", "B", "B", "B", "C", "C", "C", "C"],
               y_pred=["B", "A", "A", "C", "B", "B", "A", "C", "C", "C", "A", "C"],
               labels=["A", "B", "C"], average="micro"))

print(f1_score(y_true=["A", "A", "A", "A", "B", "B", "B", "B", "C", "C", "C", "C"],
               y_pred=["B", "A", "A", "C", "B", "B", "A", "C", "C", "C", "A", "C"],
               labels=["A", "B", "C"], average="macro"))

结果：

             precision    recall  f1-score   support

          A       0.50      0.50      0.50         4
          B       0.67      0.50      0.57         4
          C       0.60      0.75      0.67         4

avg / total       0.59      0.58      0.58        12

0.5833333333333334
0.5793650793650794

参考

Macro-F1 Score与Micro-F1 Score

分类指标之p值，r值，F1值，微平均和宏平均
假设有12个样本可被分为A，B, C 三个类别，某个分类器的结果如下：真实预测ABAAAAACBBBBBABCC...
ROC曲线，AUC，和P-R曲线的关系
ROC曲线，AUC，和P-R曲线的关系前言：二值分类器的指标很多，比如precision、recall、F1 s...
指标、性能
模型指标 MSE：均方误差，值越小越好RMSE：均方根误差，值越小越好MAE：平均绝对误差，值越小越好R平方：【0...
7.8 回归模型评估与交叉验证
回归模型评估有三种方法，分别是：平均绝对值误差、均方误差和R平方值，如表1所示： 7.8.1 平均绝对误差平均绝...
机器学习中的常用评价指标汇总
机器学习中的评价指标简要介绍精度、精确率、召回率、P-R曲线、F1 值、TPR、FPR、ROC、AUC等指标，还...
145.如何评价个性化推荐系统的效果-2
145.1 E值 E值表示查准率P和查全率R的加权平均值，当其中一个为0时，E值为1，其计算公式：b越大，表示查准...
精确率、召回率和F1
精确率，又称查准率（Precision，P）：召回率，又称查全率（Recall，R）： F1值：二分类时当标...
R语言入门笔记(2) - R语言科学计算
R语言科学计算分类统计 mean()，求平均值 min()，求最小值 sd()，求标准差数组和矩阵数组与矩阵...
统计学基础2018-05-20
方差(Deviation)：每个样本值与全体样本值的平均数之差平方值的平均数。用来衡量数据和平均值的偏离程度。方差...
NSArray 快速求最值
NSArray 快速求总和最大值最小值和平均值