1.混淆矩阵
混淆矩阵是机器学习中总结分类模型预测结果的情形分析表,以矩阵形式将数据集中的记录按照真实的类别与分类模型作出的分类判断两个标准进行汇总。这个名字来源于它可以非常容易的表明多个类别是否有混淆(也就是一个class被预测成另一个class)
2.confusion_matrix函数的使用
官方文档中给出的用法是
sklearn.metrics.confusion_matrix(y_true, y_pred, labels=None, sample_weight=None)
y_true: 是样本真实分类结果,y_pred: 是样本预测分类结果
labels:是所给出的类别,通过这个可对类别进行选择
sample_weight : 样本权重
from sklearn.metrics import confusion_matrix
labels = [0,1,2]
y_true=[2,1,0,1,2,0]
y_pred=[2,0,0,1,2,1]
cm = confusion_matrix(y_true, y_pred, labels=labels)
print pd.DataFrame(mc, index=range(0,len(labels)), columns=range(0,len(labels)))
print 'Accuracy', metrics.accuracy_score(true_labels, predicted_labels)
print 'Precision', metrics.precision_score(true_labels, predicted_labels, average='weighted')
print 'Recall', metrics.recall_score(true_labels, predicted_labels, average='weighted')
网友评论