cox风险比例模型

作者: 数据控的迷妹 | 来源:发表于2020-04-14 22:54 被阅读0次
    Cox模型的基本假设为:

    在任意一个时间点,两组人群发生时间的风险比例是恒定的;或者说其危险曲线应该是成比例而且是不能交叉的;也就是如果一个体在某个时间点的死亡风险是另外一个体的两倍,那么在其他任意时间点的死亡风险也同样是2倍。

    Cox模型与Kaplan-Meier法:

    •Kaplan-Meier法是非参数法,而Cox模型是半参数法,一般来说在符合一定条件下,后者的检验效应要大于前者
    •Kaplan-Meier法一般处理单因素对研究生存结局的影响,而Cox模型可以同时处理多个因素对生存结局的影响

    在R中计算Cox模型
    library("survival")
    library("survminer")
    data("lung")#用lung数据集
    #查看性别因素对生存结局的影响
    res.cox <- coxph(Surv(time, status) ~ sex, data = lung)
    summary(res.cox)
    #Call:
    coxph(formula = Surv(time, status) ~ sex, data = lung)
    
      n= 228, number of events= 165 
    
           coef exp(coef) se(coef)      z Pr(>|z|)   
    sex -0.5310    0.5880   0.1672 -3.176  0.00149 **
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
    
        exp(coef) exp(-coef) lower .95 upper .95
    sex     0.588      1.701    0.4237     0.816
    
    Concordance= 0.579  (se = 0.021 )
    Likelihood ratio test= 10.63  on 1 df,   p=0.001
    Wald test            = 10.09  on 1 df,   p=0.001
    Score (logrank) test = 10.33  on 1 df,   p=0.001
    
    lung.png

    结果解读:
    1.z的列给出Wald统计值。它对应于每个回归系数与其标准误差的比率(z = coef / se(coef))。 wald统计量评估给定变量的β(ββ)系数是否在统计学上显着不同于0.从上面的输出,我们可以得出结论,变量性别具有高度统计上显着的系数。
    2.第二个特征coef就是公式中的回归系数b(有时也叫做beta值).对于具有较高该变量值的受试者,正号表示危险(死亡风险)较高,因此预后更差。变量性别被编码为数字向量。 1:男,2:女。 Cox模型的R总结给出了第二组相对于第一组的风险比(HR),即女性与男性。在这些数据中,性别的β系数= -0.53表明女性死亡风险(较低的存活率)低于男性。
    3.exp(coef)则是Cox模型中最主要的概念风险比(HR-hazard ratio):
    •HR = 1: No effect
    •HR < 1: Reduction in the hazard
    •HR > 1: Increase in Hazard
    在癌症研究中:
    HR> 1 is called bad prognostic factor
    HR < 1 is called good prognostic factor
    4.最后,输出给出了模型总体显着性的三个替代测试的p值:似然比检验,Wald检验和得分数据统计。这三种方法是渐近等价的。对于足够大的N,它们将给出类似的结果。对于小N,它们可能有所不同。对于小样本量,似然比检验具有更好的行为,因此通常是优选的。
    上面输出结果详细解读:
    z(-3.176)值代表Wald统计量,其值等于回归系数coef除以其标准误se(coef),即z = coef/se(coef);有统计量必有其对应的假设检验的显著性P值(0.00149),其说明bata值是否与0有统计学意义上的显著差别。
    coef(-0.5310)值小于0说明HR值小于1,而这里的Cox模型是group two相对于group one而言的,那么按照测试数据集来说:male=1,female=2,即女性的死亡风险相比男性要低
    exp(coef)等于0.59,即风险比例等于0.59,说明女性(female=2)减少了0.59倍风险,女性与良好预后相关
    lower .95 upper .95则是exp(coef)的95%置信区间

    同时考虑年龄、性别以及ECOG performance score(ph.ecog)对生存结局的影响

    res.cox <- coxph(Surv(time, status) ~ age + sex + ph.ecog, data =  lung)
    summary(res.cox)
    #Call:
    coxph(formula = Surv(time, status) ~ age + sex + ph.ecog, data = lung)
    
      n= 227, number of events= 164 
       (1 observation deleted due to missingness)
    
                 coef exp(coef)  se(coef)      z Pr(>|z|)    
    age      0.011067  1.011128  0.009267  1.194 0.232416    
    sex     -0.552612  0.575445  0.167739 -3.294 0.000986 ***
    ph.ecog  0.463728  1.589991  0.113577  4.083 4.45e-05 ***
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
    
            exp(coef) exp(-coef) lower .95 upper .95
    age        1.0111     0.9890    0.9929    1.0297
    sex        0.5754     1.7378    0.4142    0.7994
    ph.ecog    1.5900     0.6289    1.2727    1.9864
    
    Concordance= 0.637  (se = 0.025 )
    Likelihood ratio test= 30.5  on 3 df,   p=1e-06
    Wald test            = 29.93  on 3 df,   p=1e-06
    Score (logrank) test = 30.5  on 3 df,   p=1e-06
    

    这里的结果形式大致上跟单因素的一样,我们主要需要看的是以下几点:

    Likelihood ratio test/Wald test/Score (logrank) test三种假设检验方法给出的P值说明Cox模型对三个因素均进行了beta值是否为0的假设检验,并且拒绝了omnibus null hypothesis(beta=0的零假设)

    该模型结果给出了三个因素各自在其他因素保持不变下的HR以及P值;比如年龄因素的HR=1.01以及P=0.23,说明年龄因素在调整了性别和ph.ecog因素的影响后,其对HR的变化贡献较小(只有1%)

    而看性别因素,HR=0.58,以及P=0.000986,说明在保持其他因素不变的情况下,年龄和死亡风险有很强的关系,女性能将死亡风险降低0.58倍,再次说明了女性与良好预后相关

    参考文章:Cox比例风险模型与R实现

    相关文章

      网友评论

        本文标题:cox风险比例模型

        本文链接:https://www.haomeiwen.com/subject/cyvqmhtx.html