最近在学习机器学习,发现有些概念还真不能按字面意思进行理解,如C-index,C指数即一致性指数(index of concordance),用来评价模型的预测能力,结局实际发生的概率和预测的概率的一致性。实际发生的和预测的一致性并不是指我们用模型预测出来有病/没病这样的一致性,这里统计学上的一致性是指假设患者A,B,通过模型预测,发现A的生存概率要高于B,也就是说A的生存时间要长于B,而在实际情况中A的生存时间是高于B的,这就是一致性。如100个人,我们最终通过模型得到了100个概率,也就是100个0-1之间的数,我们将这100个数,按照从小到大排列,再依次将这100个人分成10组,每组10个人,实际的概率就是这10个人中发生疾病的比例,预测的概率就是每组预测得到的10个数的平均值,然后比较这两个数,一个作为横坐标,一个作为纵坐标,就得到了一致性曲线图
网友评论