题目:Nomograms to Predict Recurrence-Free and Overall Survival After Curative Resection of Adrenocortical Carcinoma
cox回归;肾上腺皮质癌的根治性切除的OS和RFS
重点看这一篇文献的统计分析方法,写的很优秀
一.纳入病人
纳入了美国13个中心共265名行肾上腺皮质癌外科手术切除的病人。
二.统计分析方法(重点)
1.模型构建
先分别对RFS和OS构建单因素cox回归模型,筛选出有统计学意义的自变量,用向后逐步回归法筛选自变量,并将有意义的自变量与与有clinical importance, scientific knowledge, and predictors identified in previously published articles的自变量一起纳入多因素cox回归模型。
2.模型诊断
#######2.1多重共线性
多重共线性,是指自变量之间存在某种相关或者高度相关的关系,其中某个自变量可以被其他自变量组成的线性组合来解释。
多重共线性的初步诊断可用相关性矩阵,相关系数>0.7,且P<0.05时可考虑自变量之间存在共线性;进一步诊断可用方差膨胀因子。
解决方案:一般按照逐步回归的方法纳入自变量时,就会自动解决多重共线性的问题,
2.2交互作用
如果构建一个logistic回归模型,响应变量为是否死亡,自变量为是否吸烟和是否喝酒,在纳入自变量时,要考虑吸烟和饮酒间有没有交互作用?即如果一个人既吸烟又喝酒,这个毒性作用是不是大于吸烟饮酒之和?或者是吸烟和饮酒间的毒性作用能中和甚至抵消?
确认方法:将两个自变量的交互项纳入回归模型,看交互项有无统计学意义。
解决方法:参考脓毒症降温治疗的文章,发现降温治疗和体温Tmax这两个自变量之间有交互效应,因此将体温Tmax进行分层,分别看每一层里降温治疗对结局的影响。
思考:如果这样分层了以后,就不好画nomogram图了。如果研究目的是画nomogram图,构建预测预后诊断模型,那么尽量不要分层;如果目的是研究某个因素对结局的影响,那么可以进行分层。
2.3考虑非线性关系
使用限制性立方样条(RCS)的方法评估age和tumor size等连续变量对结局的影响,根据结果将这些连续变量转化为分类变量。
分类变量
3.模型评价
(1).C statistics评估区分度;
(2).重抽样calibration plot评估校准度;
(3).用nomogram图计算每个病人的得分,然后根据得分将病人分为三层,行log-rank检验画三层间的Kaplan-Meier Curves。文章里写的(3)的目的是 set to further assess calibration,我认为(3)可以起到一个评估临床效能的作用,类似于DCA。
三.结果
Table1和2是针对OS和RFS的单因素和多因素cox回归;
Figure1是nomogram图;
Figure2是用nomogram图对每个患者评分,将患者分为三层,然后用log-rank检验画三层在OS和RFS的Kaplan-Meier Curves。
KM curves
Figure3是画calibration plot
没有将数据分为训练测试集,而是采取重抽样法验证校准度。
calibration plot
网友评论