美文网首页SPSS统计分析
Logistic回归三部曲(3)

Logistic回归三部曲(3)

作者: dming1024 | 来源:发表于2019-05-31 22:27 被阅读33次

    上节我们利用SPSS中的二元Logistic回归,成功建立了三个模型:

    建立模型最终目的,是为了得到方程中的P值,通过P值的大小来对最终结果进行定性的判断。默认P>0.5时,我们关系的事件发生(在本文中指的是会发生癌症);当P<0.5时,我们所关心的事件则不会发生。Logistic回归分析可以写成更一般的形式:

    Ln(P/(1-P))= f(x) =β0+β1X1+β2X2+…+βi*Xi

    则P值的计算公式如下:


    将数据中的自变量带入模型,即可得到每个样本对于的P值,可根据P值以及分类信息,进行ROC图的绘制,结合尤登指数(Youdeng index),选择最合适的cutoff值,使得模型的灵敏度、特异性达到最佳。

    下面我们就分步采用上述的模型A、B、C计算199例样本的P值,记为Pa,Pb,Pc。使用模型A计算各样本的P值Pa,过程如下:

    点击【继续】、【确定】

    在【数据视图】的最后一列,会多出一列名为【PRE_1】,即是我们用模型A得到的Pa,其值的含义代表癌症发生的概率,其中第一个样本癌症发生率为0.889,极有可能发生癌症,属于高危人群;第二个样本癌症发生率仅为0.005,基本不可能发生癌症。

    采用同样的方法计算模型B,模型C的P值,分布记为Pb,Pc

    通过ROC曲线比较3个模型的鲁棒性:【分析】→【ROC曲线图】,在ROC曲线界面,将‘预测概率a’,‘预测概率b’以及‘预测概率c’,导入【检验变量】;将‘status’导入【状态变量】,设置【状态变量的值】为1(这里我们定义“1”是我们感兴趣的事件)

    在【输出文档】中查看分析结果

    ROC分析结果显示:模型A的AUC=0.952;模型B的AUC=0.982;模型C的AUC=0.994。

    AUC的面积越是接近1,表明模型对结果的判断越准确,完美的模型AUC=1,无效的模型AUC=0.5,即对角线,对于二分类的状态变量模型的AUC基本上都会大于0.5,若是你算出来小于0.5,极有可能是你操作过程中【状态变量的值】设置错误了。

    至此,我们已经学完了基本的二元Logistic回归分析,下一节我们会讲述如何使用ROC分析来选择模型最佳cutoff值。微信公众号后台回复“Logistic回归数据”,获得数据下载链接后,可以自己在本地尝试练习。
    转自“医学统计园”微信公众号,欢迎扫描二维码关注

    相关文章

      网友评论

        本文标题:Logistic回归三部曲(3)

        本文链接:https://www.haomeiwen.com/subject/uzsntctx.html