回归分析详细解读

作者: spssau | 来源:发表于2019-07-03 12:24 被阅读1次

在上一篇(相关分析一篇概全)文章中,我们总结了关于相关分析的内容。编写的过程让我想起曾经回答过的一个问题:“为什么同时使用相关分析和回归分析?”

相信很多人也有这样的疑问,既然都是研究变量间的关系,已经进行过相关分析为什么还要使用回归分析呢?

相关与回归的区别

其实,相关分析与回归分析的研究目的并不相同。相关分析用于描述变量之间是否存在关系,而回归分析则是研究影响关系情况,反映一个X或者多个X对Y的影响程度。

相关与回归区分

相关分析只能研究变量之间相关的方向和程度,却不能得到变量之间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况,而这些都可以通过回归分析得出。

因而分析时首先应该确定研究变量之间是否存在关系,即先进行相关分析。当两个变量之间存在显著的关联时,再进行回归分析。有了相关关系,才可能有回归影响关系,如果没有相关关系,那么也不应该有影响关系。

 

清楚了相关与回归的区别,我们开始正式介绍今天的主角——回归分析

 

01 回归分析概念

回归分析用于研究变量之间的影响关系情况。比如,消费者对某产品购买意愿的影响因素研究;或者员工敬业度与工作绩效之间的关系研究等。同时回归分析也可用于估计与预测。

02操作步骤

案例:为研究在线学习课程满意度的影响因素,收集300份数据,将平台交互性、教学资源、课程实施、课程设计共四个因素作为自变量,将学生满意度作为因变量,利用回归分析方法进行分析(涉及题目均采用李克特五级量表)。

首先,通过相关分析得出平台交互性、教学资源、课程实施、课程设计共四个因素与满意度均有着显著的正相关关系

因此,将4个变量均纳入回归模型分析。

SPSSAU分析界面

这里可以选择是否保存残差和预测值,可用于检验回归模型构建情况和预测分析。

*注意:如果X为定类数据,直接放入模型时,一般是不会对其进行分析,而仅仅是作为控制变量(可能对模型有干扰因而放入的项)纳入模型。如果想对定类数据进行分析,则要进行虚拟变量设置。(操作路径:数据处理→生成变量→虚拟变量)

03 结果分析


线性回归分析结果

第一步首先对模型情况进行分析

包括模型拟合情况(R²),是否通过F检验。

由上图可知,模型R²值为0.402,意味着平台交互性,教学资源,课程设计,课程实施可以解释学生在线学习课程满意度的40.2%变化原因。回归模型通过F检验(F=49.628,P<0.05),说明至少一个变量会对满意度产生影响关系。

第二步分析X的显著性

分析X的显著性(P值),如果呈现出显著性,则说明X对Y有影响关系。如果不显著,则应剔除该变量。

可以看到,四个解释变量对满意度的显著性分析P值均小于0.05。

第三步:判断X对Y的影响关系方向及影响程度

结合回归系数B值,对比分析X对Y的影响程度。B值为正数则说明X对Y有正向影响,为负则说明有负向影响。

通过回归系数来看,模型中四个解释变量的B值分别为0.110、0.150、0.271、0.079说明

平台交互性,教学资源,课程设计,课程实施对满意度均呈现出显著的正向影响关系。

第四步:写出模型公式

​模型公式为:满意度=1.600 + 0.110*平台交互性 + 0.150*教学资源 + 0.271*课程设计 + 0.079*课程实施

第五步:对分析进行总结

SPSSAU智能分析建议

04 其他指标说明

(1)VIF值:用于检验模型共线性问题,如果全部小于10(严格是5),则说明模型没有多重共线性问题,模型构建良好;反之若VIF大于10说明模型构建较差。如果出现多重共线性问题,可使用使用逐步回归分析/岭回归分析或者进行相关分析,手工移出相关性非常高的分析项。

(2)D-W值:用于检验变量自相关性,一般在2附近(1.7~2.3之间),则说明没有自相关性,模型构建良好,反之若D-W值明显偏离2,则说明具有自相关性,模型构建较差。

(3)残差正态性分析:用于检验模型构建情况,使用“正态图”检测残差正态性情况,如果残差直观上满足正态性,说明模型构建较好,反之说明模型构建较差。如果残差正态性非常糟糕,建议重新构建模型,比如对Y取对数后再次构建模型等。

使用路径:SPSSAU→可视化→正态图

(4)异方差性:将保存的残差项,分别与模型的自变量X或者因变量Y,作散点图,查看散点是否有明显的规律性,比如自变量X值越大,残差项越大/越小,这时此说明有规律性,模型具有异方差性,模型构建较差。

使用路径:SPSSAU→可视化→散点图

上图是回归分析保存的残差值与自变量作散点图,用于检测异方差性,上图可以看出,X变化时,Y并不会变大或者变小,因而说明无关联性,也即说明没有异方差性。

05 其他说明

如果回归分析出现各类异常,可通过比如描述分析、箱线图、散点图等查看数据中是否有异常值,找出异常值,并且处理掉异常值。也或者使用稳健回归(Robust回归进行分析,Robust回归是专门处理异常值情况下的回归模型)。

在进行相关分析时,不需要特别区分自变量X(解释变量)和因变量Y(被解释变量)。但在做回归分析时,首先要确定X和Y。有时由于问卷没有设计对应的问卷题项(比如上面的满意度对应题目),那么建议可以将X所有题项概括计算平均值来表示Y。

好了,到这里一份完整的回归分析就完成了。

登陆SPSSAU官网体验SPSS在线分析。

相关文章

网友评论

    本文标题:回归分析详细解读

    本文链接:https://www.haomeiwen.com/subject/tpkqhctx.html