作者:白介素2
本文内容包括:
- DCA曲线的背景知识,原理
- R语言演示完整实现
- DCA绘图参数调整
- DCA曲线相关参考资料集合
广而告之
说一个事,鉴于简书平台在信息传播方面有不足之处,应粉丝要求,白介素2的个人微信平台已经开启,继续聊临床与科研的故事,R语言,数据挖掘,文献阅读等内容。当然也不要期望过高,微信平台目前的定位是作为自己的读书笔记,如果对大家有帮助最好。如果感兴趣, 可以扫码关注下。
R语言实现风险模型决策分析-Decision Analysis
基本背景知识
- 多变量回归模型广泛用于医学文献中以用于诊断或预测。常规地,使用诸如灵敏度和特异性的诊断性能(ROC曲线)的度量来评估这些模型的充分性,其不能解释特定模型的临床效用。ROC追求的是诊断的准确性.但在真实的临床环境中,准确与患者是否受益不能划上等号。
- 更简单的来讲,标志物的诊断是需要选择一个临界值的,这时就会出现假阳性(FP)和假阴性(FN),对假阳性的病人是过度治疗了,而对假阴性则是漏诊了。这两种情况无法避免,因此我们就要想方设法让病人获益最大化。
DCA曲线
-
决策曲线分析(DCA)越来越多地用于评估临床研究中的诊断测试和/或预测模型。DCA的优势在于它将患者或决策者的偏好整合到分析中。传统的诊断性能指标,如敏感性,特异性和受试者工作特征曲线下面积(AU-ROC)仅测量一种预测模型对另一种预测模型的诊断准确性,但未能考虑特定模型的临床效用。DCA曲线是由纪念斯隆凯特琳癌症研究所的生物统计AndrewVickers博士开创性的提出原创论文.
-
开发DCA是为了克服这个问题。DCA的一个关键概念是阈值概率,Vickers在开创性论文中定义了“阈值概率p t,即治疗的预期收益等于避免治疗的预期收益。近年来,DCA分析被越来越多的顶级杂志推荐使用,诸如JAMA,JCO,BMJ等.
-
解释下概率阈值的概念,是通过计算与每项检查和治疗相关的预期获益和风险差异获得。预期获益由患疾病并接受治疗(真阳性)的患者数表示。预期风险由未患疾病、但接受治疗(假阳性,误差乘以加权因子)的患者数乘以加权因子表示。加权因子可明确患者接受不充分治疗或过度治疗的风险。可能还是比较绕,我们举例来说明:
Figure1
解读实际的DCA曲线
-
在Figure1中,表示的是用于诊断败血症的两个模型的决策曲线分析。先解释下图,比较不同模型的效能当然可以用ROC的曲线下面积,但这里用的是DCA。Figure中的横坐标为阈概率(ThresholdProbability)。当各个模型评价达到某个值时,患者i的败血症的风险概率记为Pi;当Pi达某个阈值(记为Pt),就界定为阳性,并采取治疗,治疗就会有获益和不获益的情况.纵坐标就是利减去弊之后的净获益率(Net Benefit, NB)。
-
在这张Fgure中,除了两个模型的曲线外,还有两条虛线,它们代表两种极端情况。横的那条表示,所有样本都是阴性(Pi<Pt),所有人都没干预,那么自然净获益为0。斜的那条表示所有样本都是阳性,所有人都接受了干预,这时如果模型的阈概率为0,净获益就会相对高。由此我们可以推断出净获益是个斜率为负值的反斜线。
-
在Figure中,我们看到pred.simple模型更接近于极端曲线,因此也就没什么应用价值。而pred.all模型则在很大的范围内,表现出比极端曲线更高的净获益,可选择的pt范围比较大,因此认为pre.all表现更优。
网友评论