临床上,经常会遇到这种问题,寻找影响患者预后的关键因素。这时,我们需要通过对患者进行一定周期的随访(时间),对患者的多项指标进行监测(自变量:影响因素),观察影响患者预后的情况(因变量:结果,疾病有无复发、患者有无发生死亡等)。
这不单单是上节Kaplan-Meier生存分析那么简单(只涉及到一个因素),也不像Logistic回归分析那样分析(只涉及到一个二分类因变量),它即涉及到一个二分类变量(有无发生),又多了一个连续变量(随访时间)以及多个自变量。这个时候Cox生存回归分析,就应运而生了。
我们同样以一组数据为例,在之前Logistic回归分析的基础上,加上一个随访数据(生存时间months),如下:
其中首先明确我们分析过程中的变量信息:
-
因变量 status:是否仍然存活,为二分类变量,1代表发生死亡,0代指非死亡(删失或存活);生存时间:代表患者存活的时间(months),如表格中第一个患者性别为男性,在第40个月时发生死亡,年龄67岁,表格中第二个患者性别为男性,在第60个月(即随访结束时)仍然存活,年龄53岁。
-
自变量 性别为二分类变量;年龄、BMI指数、miR21、miR145、AFP均为计量资料;居住地区为多分类变量,包括农村、乡镇、城市;文化程度为多分类变量,包括小学及以下,初中,高中,大学及以上;婚姻状况为二分类变量,包括已婚,离婚。
-
分组统计 以因变量为分组信息,统计各自变量信息,可参考之前的Logistic回归分析教程。
下面我们就利用以上数据,进行Cox回归分析:
选择【分析】→【生存函数】→【Cox回归】
在弹出的【Cox回归】菜单中,进行如下设置:
将‘months’导入【时间】,‘status’导入【状态】,【定义事件】的值为1;
将所有自变量导入【协变量】,【方法】下菜单中选择【转发:条件】
选择右上角的【分类】,对分类变量进行哑变量的设置:
将【协变量】中分类变量,全部导入【分类协变量】
在【更改对比】中,选择【指示符】,参考类别选择【第一个】,点击【更改】【继续】
回到上级菜单中,点击【确定】,完成Cox回归分析
在【输出文档】中查看分析结果
表1 【案例处理摘要】 对数据进行初步描述,一共199例样本,其中99例发生“死亡”,100例删失(即截止到随访结束,仍然存活或者由于某些原因提前结束随访)
表2 【分类变量编码】这就是刚刚在【分类】菜单下,对协变量进行哑变量设置的结果,如文化程度有4个变量,一共需要3组哑变量进行设置,相比于小学及以下(第一个),文化程度为初中的定义为文化程度(1),文化程度为高中的定义为文化程度(2),文化重读为大学及以上的定义为文化程度(3)。
表3 【不在方程中的变量】这是Cox回归分析的开始
表4 【模型系数的综合测试】一共进行了4次的拟合过程
表5 【方程中的变量】进行四次的回归分析,一共纳入4组变量,包括年龄、miR21、miR145以及文化程度,如上文所述文化程度(1)表示初中,文化程度(2)表示高中,文化程度(3)表示大学及以上。
这是Cox回归分析中最重要的表格,从该表格中我们可以得知,年龄、miR21、miR145以及文化程度均是癌症患者在5年内(60个月)发生死亡的危险因素。每当年龄增加1岁,因肝癌死亡的风险就增加1倍;而当miR21的表达水平升高1.0单位后,患者5年内死亡的风险高达19.35倍,可见抑制miR21以及miR145的高表达,对于降低肝癌患者的死亡风险是多么的重要啊。
此外Cox回归可写成更为一般的格式:
S(t)=S****0****(t)xExp(β1X1+β2X2+…βiXi)*
以上就是利用SPSS软件进行Cox回归分析的过程,欲想熟练掌握,还需实战练习。微信公众号后台回复“cox回归分析数据”,获取下载链接,可在本地进行实践。
转自“医学统计园”微信公众号,欢迎扫描二维码关注
网友评论