总结

————————————————————————————————————————————————
这些都是比识别率更客观的评价标准,
~混淆矩阵中通过计算系统识别率和瞎猜的概率,如果识别率大于瞎猜的概率就是性能比较好,
~roc曲线(TP\FP,FN\FP)越在左上角,性能越好
~AUC阴影面积越大,性能越好
~EER越小,性能越好
想知道具体情况,看下面本节课的内容~
————————————————————————————————————————————————
上一讲中的识别率为99.61%,比如人脸识别的准确率达到99.8%,他是不是一个性能好的系统?

冒用身份的人只有不到百分之一,
也就是我们什么都不做,这个识别率也是大于99%的,



仍然以二分类为例,竖着实际,横着预测值,识别结果TP和TN是正确的,两种错误的情况FN,FP,这四个数构成的矩阵是混淆矩阵





这里全猜为负样本是因为,负样本的更多



在概率下的混淆矩阵,一定满足

以上两个为条件,探索评价系统性能的另一个重要的指标



改革开放来了,新鲜空气会进入,但是更多的苍蝇蚊子也会增加,

具体到支持向量机这个系统,如何理解TP增加,FP也增加! 回顾


得到另一个系统,这个系统想比前面的那个系统


更多的测试样本满足第一个系统,所以会有更多的正样本被判断为正样本的比例增加,更多的负样本判断为-样本的比例增加了,



系统性能更好就是更大的TP,更小的FP,要换方法,从算法本身入手,设计更好的算法,为此引入ROC曲线



两者是一样的,因为

所以知道了一个就知道了另一个




因此根据ROC可以判断系统性能的另外两个指标

越大,系统性能越好,


越低性能越好
网友评论