tableone和compareGroups都是做基线信息表的常用R包,前段时间帮同学处理数据,觉得compareGroups不仅可以进行基线信息表的绘制,而且还能一次性完成所有单因素分析结果的表格,为了验证绘制表格的的准确性,分别应用R包常用函数及SPSS软件进行双重验证
临床常见的结局事件的变量为二分类及生存资料,当结局变量为二分类变量时,R语言应用GLM(广义线性模型)函数进行验证,连接函数为logit;当结局变量为生存资料时,应用coxph函数进行验证
因变量分布选择一个连续型变量和一个分类变量进行模拟
分析中应用的数据集为survival包的colon数据集,数据集详情可进入如下连接查看https://vincentarelbundock.github.io/Rdatasets/doc/survival/colon.html
直接上代码
library(compareGroups)
library(survival)
data(colon)#加载数据集
df <- colon#定义数据集
df <- df[,-df$study]#删除study列
str(df)#展示数据集
数据集展示
可以看到,其中rx化疗方案为分类变量并有3个不同的水平,age年龄为连续性变量,以下用这两个变量作为自变量进行模拟验证
t1 <- descrTable(status ~rx + age,#构建表格方程
show.all = T,#显示所有人群情况,如果表格大可以删除此项
show.p.ratio =T,#显示分组后每个分组的P值情况
show.ratio = T,#显示OR或者HR值,函数会根据方程自动调整
data = df)#确定数据集
t1#展示数据集
二分类结局变量结果展示
以下以rx为自变量,以status为结局变量构建逻辑回归并查看p值及OR值
fit.rx<- glm(status ~ rx, #方程
family = binomial(link ="logit"),#连接函数为logit
data = df)
summary(fit.rx)#展示逻辑回归的主要参数
exp(coef(fit.rx))#计算OR值
glm函数的结果与上述compareGroups包结果一致
可以看到,glm函数算出的p值在rxLev为0.709,rxLev+5FU为1.53e-07,小于0.001,与上述compareGroups一致;glm计算rxLev的OR位0.0958,rxLev+5FU为0.546,其四舍五入后的结果和上述一致
以下为SPSS的计算过程及结果展示,显示与上述两个函数均一致
选择自变量及因变量并设定哑变量 结果展示以下以age为连续型自变量自变量进行模拟分析,t1表已经展示了age作为自变量的相关统计学参数,以下利用GLM函数计算验证符合程度
fit2 <- glm(status ~ age, #方程
family = binomial(link ="logit"),#连接函数为logit
data = df)
summary(fit2)#展示逻辑回归的主要参数
exp(coef(fit2))
glm函数计算显示age的p值为0.296,OR为0.9959,四舍五入后与上述compareGroups计算一致
以下应用SPSS模拟age变量为自变量并计算结果
spss计算age为自变量的结果展示,结果与GLM及ompareGroups包一致以下展示结局变量为生存资料时候compareGroups包计算的HR与P值情况并同时与coxph函数及spss计算结果对比
df$ttevent <- with(df, Surv(time, status==1))#df数据集内新建新的一列,定义status为1事件发生
t.time <- descrTable(ttevent ~ rx + age,
show.all = T,
show.p.ratio =T,
show.ratio = T,
data = df)
t.time#展示结果表格
结局变量为生存资料进行单因素分析结果
surv.fit<-coxph(Surv(time,status==1)~rx,data = df)#以rx为自变量构建cox回归方程
summary(surv.fit)#展示cox结果
coxph显示rxlev的P值为0.786,HR为0.979,rxlev+5fu的P值为1.47e-07,HR为0.643,与上述compareGroups包一致
以下利用spss计算进行验证
设定生存时间及生存状态,指定结局时间,设定哑变量结果显示rxlev的P值为0.786,HR为0.979,rxlev+5fu的P值为0.000,HR为0.643,与上述compareGroups包及coxph函数一致
surv.age<-coxph(Surv(time,status==1)~age,data = df)#以age为自变量构建cox回归方程
summary(surv.age)#展示cox结果
coxph函数显示age的p值为0.382,HR为0.9976,四舍五入后与compareGroups包一致
以下利用SPSS验证
参数设定
结果上述两者一致
综上,无论结局变量为分类或者生存资料,利用compareGroups包绘制单因素分析的结果都是准确的,其实不仅是两类变量,
网友评论