从临床预测模型角度,构建模型有三度。区分度、校准度和临床适用度。
区分度我们通常采用的是AUROC或C Index;校准度评价采用的是HL(hosmer lemeshow)检验以及校准曲线。
那么有没有那个指标能够综合区分度和校准度的表现呢?那么Briser Score就是了。
Brier Score(BS)评分用于评价模型的总体表现(overall performance),如果模型总体表现完美,那么预测值和实际值就完全一致,那么BS评分就等于零。如果BS>0.25,某些文献则认为worthless。
也有文章说Brier score不适合应用于模型评价
图片.png
网友评论