一个变量往往受到多个变量的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。
例如:对一个护肤品的总体喜好度可能会同时受到肤感、香味、质地形态、功效的影响。我们可以通过多元线性回归模型了解各个自变量对于因变量的影响。
经过本篇文章学习,您能够对问卷数据做以下分析:
①建立多元线性回归模型
②了解各个自变量对因变量的显著影响关系
多元线性回归
我们看一个案例:
示例1:我们得到AB-2款眼霜对比时的总体喜好度,总体喜好度会不会受到肤感、香味、质地形态、功效的喜好度判断?以及各自的影响是多大?
1.分析-回归-线性
2.将【总体喜好度】选入因变量,将【肤感】【香味】【质地形态】【功效】选入自变量
3.先设置统计量
勾选【共线性诊断】【Durbin-Wstson(德斌沃森)】,点击继续
4.设置【绘制(图)】
将ZRESID选入Y轴,将ZPRED选入X轴
勾选直方图、正态概率图,点击继续
设置完毕后,点击确定
5.结果解读
STEP1——判断R方的拟合度
首先看R方,回归模型的拟合度调整R方=0.909,拟合度较好,意味着这4个自变量能够解释因变量变化原因的90.9%,即总体喜好度有90.9%是由效果、肤感、香味、质地形态影响的;
一般来说R方高于30%代表拟合良好,实际数据10%左右也可以接受
可参考:
小效应:R (0.1~0.3),对应 R方(0.01~0.09)
中等效应:R (0.3~0.5),对应 R方(0.09~0.25)
大效应:R (0.5~1),对应 R方(0.25~1)
分析各个自变量的显著性:
首先看B列,均为正数,说明这几个自变量对因变量的影响都是正相关的
再看显著性,<0.05的为功效、质地形态2个自变量,说明这2个维度都可以显著影响到到总体喜好度的判断
通过本次分析,我们可以得到这样的线性回归方程:
本次总体喜好度= -0.065+0.576*功效+0.111*肤感+0.076*香味+0.297*质地形态
STEP2——线性回归模型的诊断
①样本独立判断?
DW值在2附近,意味着样本独立,本案例的的德斌沃森系数在2附近,说明样本独立
②残差正态判断?
通过直方图发现:标准化残差基本服从均值为0,标准差为1的正态分布
从正态概率图(P-P图)也可以看出,散点基本围绕在第一象限对角线上散布,从而判断残差基本服从正态分布
③残差方差齐性判断?
通过对标准化残差和标准化预测值绘制的散点图可以看出,标准化残差的散点波动范围基本保持稳定,不随标准化预测值的变化而变化,可以认为基本满足方差齐性
④自变量共线性判断?
容差值大于0.1,且小于1,方差膨胀因子VIF<5或10,代表不存在严重共线性问题。不会影响回归结果的准确性。
综合以上的线性回归模型的诊断可以得出:回归模型的结果基本准确。
网友评论