1、四个描述过程挖掘的关键因素
fitness、simplicity、precision、generalization(泛化能力)
下面是一个confuse matrix
confuse matrix
中间的重叠部分(TP)越大越好
在上图中的FN(False Negative)是我们需要去避免发生的,因为照理(Model)说这些事情不应该发生,但是事实上发生了
同时,FP(False Positive)也是不应该发生的
下面讨论第一个指标:
- recall: recall
-
precision:
precision
当这两个指标的值都很高,说明这个模型很好
网友评论