美文网首页Cook R科研信息学R语言学习
再谈compareGroups包的作用(与SPSS及不同函数多重

再谈compareGroups包的作用(与SPSS及不同函数多重

作者: 灵活胖子的进步之路 | 来源:发表于2020-12-16 00:08 被阅读0次

    tableone和compareGroups都是做基线信息表的常用R包,前段时间帮同学处理数据,觉得compareGroups不仅可以进行基线信息表的绘制,而且还能一次性完成所有单因素分析结果的表格,为了验证绘制表格的的准确性,分别应用R包常用函数及SPSS软件进行双重验证

    临床常见的结局事件的变量为二分类及生存资料,当结局变量为二分类变量时,R语言应用GLM(广义线性模型)函数进行验证,连接函数为logit;当结局变量为生存资料时,应用coxph函数进行验证

    因变量分布选择一个连续型变量和一个分类变量进行模拟

    分析中应用的数据集为survival包的colon数据集,数据集详情可进入如下连接查看https://vincentarelbundock.github.io/Rdatasets/doc/survival/colon.html

    直接上代码

    library(compareGroups)
    library(survival)
    data(colon)#加载数据集
    df <- colon#定义数据集
    df <- df[,-df$study]#删除study列
    str(df)#展示数据集
    
    数据集展示

    可以看到,其中rx化疗方案为分类变量并有3个不同的水平,age年龄为连续性变量,以下用这两个变量作为自变量进行模拟验证

    t1 <- descrTable(status ~rx + age,#构建表格方程
                     show.all = T,#显示所有人群情况,如果表格大可以删除此项
                     show.p.ratio =T,#显示分组后每个分组的P值情况
                     show.ratio = T,#显示OR或者HR值,函数会根据方程自动调整
                     data = df)#确定数据集
    t1#展示数据集
    
    二分类结局变量结果展示

    以下以rx为自变量,以status为结局变量构建逻辑回归并查看p值及OR值

    fit.rx<- glm(status ~ rx, #方程
                family = binomial(link ="logit"),#连接函数为logit
                data = df)
    summary(fit.rx)#展示逻辑回归的主要参数
    exp(coef(fit.rx))#计算OR值
    
    glm函数的结果与上述compareGroups包结果一致

    可以看到,glm函数算出的p值在rxLev为0.709,rxLev+5FU为1.53e-07,小于0.001,与上述compareGroups一致;glm计算rxLev的OR位0.0958,rxLev+5FU为0.546,其四舍五入后的结果和上述一致

    以下为SPSS的计算过程及结果展示,显示与上述两个函数均一致

    选择自变量及因变量并设定哑变量 结果展示

    以下以age为连续型自变量自变量进行模拟分析,t1表已经展示了age作为自变量的相关统计学参数,以下利用GLM函数计算验证符合程度

    fit2 <- glm(status ~ age, #方程
                family = binomial(link ="logit"),#连接函数为logit
                data = df)
    summary(fit2)#展示逻辑回归的主要参数
    exp(coef(fit2))
    
    glm函数计算显示age的p值为0.296,OR为0.9959,四舍五入后与上述compareGroups计算一致

    以下应用SPSS模拟age变量为自变量并计算结果

    spss计算age为自变量的结果展示,结果与GLM及ompareGroups包一致

    以下展示结局变量为生存资料时候compareGroups包计算的HR与P值情况并同时与coxph函数及spss计算结果对比

    df$ttevent <- with(df, Surv(time, status==1))#df数据集内新建新的一列,定义status为1事件发生
    
    t.time <- descrTable(ttevent ~ rx + age,
                     show.all = T,
                     show.p.ratio =T,
                     show.ratio = T,
                     data = df)
    t.time#展示结果表格
    
    结局变量为生存资料进行单因素分析结果
    surv.fit<-coxph(Surv(time,status==1)~rx,data = df)#以rx为自变量构建cox回归方程
    
    summary(surv.fit)#展示cox结果
    
    coxph显示rxlev的P值为0.786,HR为0.979,rxlev+5fu的P值为1.47e-07,HR为0.643,与上述compareGroups包一致

    以下利用spss计算进行验证

    设定生存时间及生存状态,指定结局时间,设定哑变量
    结果显示rxlev的P值为0.786,HR为0.979,rxlev+5fu的P值为0.000,HR为0.643,与上述compareGroups包及coxph函数一致
    surv.age<-coxph(Surv(time,status==1)~age,data = df)#以age为自变量构建cox回归方程
    
    summary(surv.age)#展示cox结果
    
    coxph函数显示age的p值为0.382,HR为0.9976,四舍五入后与compareGroups包一致

    以下利用SPSS验证


    参数设定
    结果上述两者一致

    综上,无论结局变量为分类或者生存资料,利用compareGroups包绘制单因素分析的结果都是准确的,其实不仅是两类变量,

    相关文章

      网友评论

        本文标题:再谈compareGroups包的作用(与SPSS及不同函数多重

        本文链接:https://www.haomeiwen.com/subject/ntuggktx.html