（二）sklearn.metrics模型性能评价

作者: 神经网络爱好者 | 来源:发表于2019-11-01 16:48 被阅读0次

（二）sklearn.metrics模型性能评价
自然语言处理中的若干问题
分类器评估方法
模型性能度量方法
数据挖掘3
零基础入门数据挖掘-Task4 建模调参
2020-04-01
从宏观上了解机器学习-模型评估与选择2
分类模型性能评价及选择
【机器学习与R语言】12- 如何评估模型的性能？

y_true：真实的标记集合。
y_pred：预测的标记集合。
labels：一个列表，指定报告中出现哪些类别。
target_names：一个列表，指定报告中类别对应的显示出来的名字。
digits：用于格式化报告中的浮点数，保留几位小数。
sample_weight：样本权重，默认每个样本的权重为 1。

from sklearn.metrics import classification_report

y_true = [0, 1, 2, 2, 2]
y_pred = [0, 1, 2, 2, 1]
label = [0, 1, 2]
target_names = ['class 0', 'class 1', 'class 2']
print((classification_report(y_true, y_pred, labels=label, target_names=target_names)))

此时的程序输出如下：

                precision    recall  f1-score   support
    class 0       1.00      1.00      1.00         1
    class 1       0.50      1.00      0.67         1
    class 2       1.00      0.67      0.80         3
avg / total       0.90      0.80      0.81         5

如果使label=[0,1]，则得到的输出如下：

                 precision    recall  f1-score   support
    class 0       1.00      1.00      1.00         1
    class 1       0.50      1.00      0.67         1
avg / total       0.75      1.00      0.83         2

3、混淆矩阵的使用

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.metrics import confusion_matrix

y_true = [0, 1, 2, 2, 2]
y_pred = [0, 1, 2, 2, 1]
target_names = ['class 0', 'class 1', 'class 2']

#混淆矩阵
sns.set()
f,ax = plt.subplots()
colormap = sns.cm.rocket_r#sns.cubehelix_palette(as_cmap=True,reverse=False)
C2 = confusion_matrix(y_true, y_pred)
C2 = pd.DataFrame(C2, index=target_names, columns=target_names)
sns.heatmap(C2, annot=True, ax=ax, cmap=colormap) #画热力图
ax.set_title('confusion matrix') #标题
ax.set_xlabel('predict') #x轴
ax.set_ylabel('true') #y轴
plt.show()

得到的图片如下：

confusion matrix