之前分享的几种方法都无法控制自变量及因变量最小组的比例。比如,连续变量分组后,可能会出现一组病例数就几个,而另一组几百个的情况;另外,一般软件的截断值只能根据截断值个数列出“最优解”,而不能列出多重种情况可供选择
以下的主要参数选择依据
![](https://img.haomeiwen.com/i22546862/ef99ebd0d74d5ea3.png)
![](https://img.haomeiwen.com/i22546862/ab2825950f248b30.png)
library(cutoff)
str(mtcars)
![](https://img.haomeiwen.com/i22546862/a131b31dc644a61e.png)
res1<- logrank(data=mtcars,
time = 'disp',#数据集
y='am', #自变量
x='wt',#因变量
cut.numb=2,#截断值选择个数
n.per=0.25,#x最小组个数比例
y.per=0.10)#y最小组个数比例
View(res1)
![](https://img.haomeiwen.com/i22546862/50fd3a6c4274b5b4.png)
以下展示完整参数用法
res2<- logrank(data=mtcars,
time = 'disp',
y='am',
x='wt',
cut.numb=2,
n.per=0.25,
y.per=0.10,
p.cut=0.05,#P值选择
strict=TRUE,#是否严格两两分组均有意义才能纳入
include='low',#分组截断值纳入哪个分组,low为纳入低数值组
round=2)#小数位数
View(res2)
![](https://img.haomeiwen.com/i22546862/5b19a69a001328c5.png)
网友评论