之前给大家介绍了logistic回归分析的SPSS操作,今天来给大家介绍如何使用sas实现logistic回归分析。Logistic回归的定义和分类在上一篇已经说过,所以这一篇只给出了logistic回归分析的代码实现。更多数据分析知识,请关注纯学术的公众号:全哥的学习生涯
一、代码实现
1.数据步
Data a;
/*此处如果已经有构建好的数据库,可以通过“文件”菜单中的导入数据选项来导入数据*/
Input x1 x2 x3 x4 y @@;
/*输入变量*/
If x1=2 then x12=1; else x12=0;
If x1=3 then x13=1; else x13=0;
/*我的数据自变量都是二分类变量,不需要设置哑变量,这里的代码是为了给大家展示一下设置哑变量的方法,假设x1变量有三个分类,这种方法把x1=1作为了参照,如果要把x1=2作为参照,可以把”If x1=2 then x12=1; else x12=0”改为”If x1=1 then x11=1; else x11=0”,如果要把x1=3作为参照,同理*/更多数据分析知识,请关注纯学术的公众号:全哥的学习生涯
Cards;
...
;
/*输入数据,此处数据省略*/
Run;
2.过程步
Proc print data=a;
Run;
/*打印数据集,这一步对于logistic回归分析来说是没有用的,但是我个人习惯是输入数据后先打印一下看一看输入的数据是不是对的,再去对数据进行分析*/
Proc logistic data=a descending ;
/*一般的习惯会把y中的“病例”编码为1,“对照”编码为0,此时需要加一个descending,有助于解释输出的结果*/
Model y=x1 x2 x3 x4 /cl rl lackfitselection=stepwise;
/*以y为因变量x1 x2 x3 x4为自变量,进行logistic回归分析。cl:输出参数估计值的置信区间;rl:输出OR的可信区间;lackfit:输出Hosmer-Lemeshow拟合优度指标;select:可以指定自变量选择的方法,这里采用stepwise,其他的选项还有forward、backward、scores等,默认为none。Model后常用的选项见表1。*/
Run;
表1:Model语句常用选项表
Selection=指定变量选择方法,如forward、backward、stepwise、scores,默认值为none
Slentry=指定变量入选标准,默认值为0.05
Slstay=指定变量剔除标准,默认值为0.05
cl指定输出参数估计的可信区间
rl指定输出OR的可信区间(OR值及其可信区间自动输出,故该选项可不加)
influence指定输出模型诊断指标,如Pearson残差、Deviance残差、帽子矩阵对角线、DFBETA和Cook距离等
iplots指定输出各诊断指标的诊断图
lackfit输出Hosmer-Lemeshow拟合优度指标
二、结果解释
图一为反映模型拟合优度的指标,以下指标的值越小,表示模型拟合的效果越好。
图 1图二为对模型总体的检验结果,p<0.05,说明模型中所有自变量整体对模型的影响有统计学意义。
图 2图三为模型参数估计结果。
图 3图四为OR值及其可信区间。
图 4图五为Hosmer-Lemeshow拟合优度指标,α可取0.1或0.2。更多数据分析知识,请关注纯学术的公众号:全哥的学习生涯
图 5
网友评论