美文网首页
医学案例 | 相关分析

医学案例 | 相关分析

作者: spssau | 来源:发表于2023-09-10 10:22 被阅读0次

     

    一、案例介绍

    某医师测量了15名正常成年人的体重(kg)与CT双肾总体积(ml)大小,数据如下表所示。据此试分析两变量是否有关系?其方向与密切程度如何?

    二、问题分析

    要分析两个定量数据之间是否有关系以及关系的方向和紧密程度,可以使用Pearson相关分析。使用Pearson相关分析,需要满足4个条件。

    条件1:两变量均为定量数据。

    条件2:两变量之间存在线性关系,通常使用散点图进行检验。

    条件3:两变量均没有异常值。

    条件4:两变量均符合正态分布。

    在本案例中,体重和双肾总体积均为定量数据,满足条件1;条件2-4需要分别进行检验。

    三、软件操作及结果解读

    (1)线性关系检验

    变量之间的线性关系通常使用散点图进行检验。散点图是通过使用两组数据构成的多个坐标点,判断两变量之间是否存在线性关系。将数据上传至SPSSAU系统,在【可视化】模块选择【散点图】,将“双肾总体积”拖拽到右侧“Y定量”分析框中,将“体重”拖拽到右侧“X定量”分析框中,然后点击开始分析,操作如下图:

    SPSSAU输出散点图如下:

    从散点图可以看出,体重和双肾总体积之间呈现出明显的线性关系,随着体重的增大,双肾总体积也不断增大。所以两变量满足条件2 存在线性关系。

    散点图除了查看是否存在线性关系,还可以查看是否存在异常值;不过通过散点图判断异常值具有很强的主观性,比如上图圈出来的点,无法做到准确判断,而Pearson相关系数易受异常值的影响,所以可以选择通过其他方式检验异常值,比如箱线图。

    (2)异常值检验

    使用箱线图可以直观识别数据的异常值,箱线图由5个点构成,分别是最大观察值、25%分位数(Q1)、中位数、75%分位数(Q3)、最大观察值,最大观察值和最小观察值的定义如下:

    最大观察值=Q3+1.5IQR,IQR=Q3-Q1

    最小观察值= Q1-1.5IQR,IQR=Q3-Q1

    如果数据存在异常值——大于最大观察值或小于最小观察值,SPSSAU将该点以“原点”形式进行展示。

    在SPSSAU【可视化】模块,选择【箱线图】,将两变量均拖拽到右侧“分析项(定量)”中,点击开始分析,操作如下图:

    SPSSAU输出体重和双肾总体积的箱线图如下:

    从箱线图可以看出,体重和双肾总体积两变量均不存在异常值,满足条件3。

    若存在异常值,可以通过异常值汇总表格如下图,查看具体异常值个数以及异常值数字,对异常值进行删除等操作。

    (3)正态性检验

    两变量均需要满足正态性,正态性可以使用多种方式进行检验,比如直方图、P-P如/Q-Q图、峰度/偏度、正态性检验等。本案例选择正态性检验。在SPSSAU【通用方法】模块,选择【正态性检验】,将两变量拖拽到右侧“分析项(定量)”分析框中,然后点击开始分析。操作如下图:

    SPSSAU输出正态性检验结果如下:

    从上表可知,针对体重、双肾总体积进行正态性检验,样本量为15<50,所以使用Shapiro-Wlik正态性检验结果,具体来看,体重、双肾总体积正态性检验对应p值均大于0.05,未呈现出显著性,说明接受原假设(原假设为数据服从正态分布),即两变量均服从正态分布,满足条件4。

    综上所述,本案例数据满足使用Pearson相关分析的条件,可以进行Pearson相关分析。

    (4)Pearson相关分析

    ①相关系数计算

    Pearson相关分析使用相关系数描述变量之间的相关关系,Pearson相关系数取值范围为[-1,1],相关系数的绝对值越接近1,说明变量之间相关性越强;绝对值越接近0,相关性越弱。相关系数大于0,代表变量之间存在正相关;相关系数小于0,代表负相关

    Pearson相关系数的计算公式如下:

    r=rac{sum(X-overline{X})(Y-overline{Y})}{sqrt{sum(X-overline{X})^2}sqrt{sum(Y-overline{Y})^2}}

    overline{X}=(43+74+51+…+54)/15=59.53

    overline{Y}=(217.22+316.18+…+266.104)/15=266.104

    sum(X-overline{X})(Y-overline{Y})=(43-59.53)*(217.22-266.104)+(74-59.53)*(316.18-266.104)+…+(54-59.53)*(252.08-266.104)=6301.038

    sqrt{sum(X-overline{X})^2}=2555.733

    sqrt{sum(Y-overline{Y})^2}=20270.495

    r=rac{6301.038}{sqrt{2555.733}sqrt{20270.495}}=0.8754

    所以,手工计算得到体重和双肾总体积的Pearson相关系数为0.8754,说明两变量之间存在高度正相关关系。

    接下来,介绍如何使用软件快速计算相关系数。

    ②软件计算

    在SPSSAU【通用方法】模块,选择【相关分析】,将“体重”拖拽到右侧“分析项X”分析框中,将“双肾总体积”拖拽到右侧“分析项Y”分析框中,选择“Pearson相关系数”,然后点击开始分析,操作如下图:

    SPSSAU输出Pearson相关分析结果如下:

    从上表可以看出,体重和双肾总体积之间相关系数为0.8754,p<0.0,5,说明两变量存在显著正相关关系,即体重与双肾总体积之间存在高度正相关关系。

    四、结论

    本案例研究体重与双肾总体积之间的关系情况,经检验,两变量均满足Pearson相关分析需要满足的4个条件。使用Pearson相关分析得到,体重与双肾总体积之间的相关系数为0.8754,p<0.05,说明两变量之间存在显著正相关关系,即体重越大,双肾总体积越大。

    五、知识小贴士

    数据不满足正态性怎么办?

    经过正态性检验,如果两个变量不符合正态分布,有以下三种选择:

    ①使用Spearman相关系数进行分析。

    ②对不服从正态分布的变量进行数据变换,如取对数等操作,对变换后的数据再进行检验。

    ③继续使用Pearson相关分析,如果对数据要求不是太严格,Pearson相关系数对不服从正态分布的数据具有一定抗性,可继续使用。

    相关文章

      网友评论

          本文标题:医学案例 | 相关分析

          本文链接:https://www.haomeiwen.com/subject/omjhvdtx.html