一、方差分析
当X为定类数据,Y为定量数据时,通常使用的是方差分析进行差异研究。X的个数为一个时,我们称之为单因素方差;X为2个时则为双因素方差;X为3个时则称作三因素方差,依次下去。当X超过1个时,统称为多因素方差。
(1)单因素方差分析
一个定类数据与一个定量数据之间的关系情况
方差分析最终分析时,首先分析p 值,如果此值小于0.05,说明呈现出差异性;具体差异再对比平均值即可。如果p值大于0.05则说明没有差异性产生。F 值属于中间过程值,想要计算 p 值,一定要先计算F 值,因而SPSSAU也将F 值结果输出。
① 方差分析结果
SPSSAU-方差分析结果
从上表可知,利用方差分析(单因素方差分析)去研究学历对于工资共1项的差异性,从上表可以看出:不同学历样本对于工资全部均呈现出显著性(p<0.05),意味着不同学历样本对于工资均有着差异性。具体分析可知:
学历对于工资呈现出0.01水平显著性(F=60.065,p=0.000),以及具体对比差异可知, 有着较为明显差异的组别平均值得分对比结果为“2.0>1.0;3.0>1.0;4.0>1.0;4.0>2.0;4.0>3.0”(同时也可以使用折线图进行直观展示)。
总结可知:不同学历样本对于工资全部均呈现出显著性差异。
方差分析对比
② 深入分析-效应量指标
效应量指标
如果方差分析显示呈现出显著性差异(p<0.05),可通过平均值对比具体差异,同时还可使用效应量(Effect size)研究差异幅度情况;
第一:方差分析时使用偏Eta方表示效应量大小(差异幅度大小),该值越大说明差异越大;
第二:方差分析使用偏Eta方表示效应量大小时,效应量小、中、大的区分临界点分别是:0.01,0.06和0.14;
第三:偏Eta方= SSB/SST;
第四:方差分析也可以使用Cohen’sf表示效应量,其计算公式为Sqrt(偏Eta方/ (1 - 偏Eta方)),Cohen’sf表示效应量大小时,效应量小、中、大的区分临界点分别是:0.10,0.25和0.40。
(2)双因素方差分析
双因素方差分析,用于分析定类数据(2个)与定量数据之间的关系情况。
例如:研究人员性别,学历对于网购满意度的差异性;以及男性或者女性时,不同学历是否有着网购满意度差异性;或者同一学历时,不同性别是否有着网购满意度差异性。双因素方差更多用于实验研究。
SPSSAU-双因素方差分析
① 双因素方差分析结果
双因素方差分析结果
从上表可知,利用双因素方差分析去研究是否高血压和药物对于胆固醇水平的影响关系,从上表可以看出:是否高血压呈现出显著性(F=65.473,p=0.000<0.05),说明主效应存在,是否高血压会对胆固醇水平产生差异关系。具体差异可通过方差分析(单因素)进行具体分析。药物呈现显著性(F=11.439,p=0.001<0.05),说明主效应存在,药物会对胆固醇水平产生差异关系。具体差异可通过方差分析(单因素)进行具体分析。
② 数据格式
双因素方差分析数据格式要求比较严格,格式如下图所示:
双因素方差数据格式
【提别提示】:
双因素方差分析基本上仅用于实验研究中,请谨慎使用。
(3)三因素方差分析
三因素方差分析,用于分析定类数据(3个)与定量数据之间的关系情况。
案例:
某研究者测试新药对于胆固醇水平是否有疗效;研究者共招募72名被试,男女分别为36名,并且男性或女性中是否高血压患者各为18名,并且当前被试的胆固醇水平基本均保持在6.5左右。最终X共分为三个,分别是药物(旧药和新药)、性别,是否患高血压;Y为胆固醇水平。
同时,明显的可以想到,实验前的胆固醇水平基数,很可能会影响到最终的胆固醇水平,因此“实验前胆固醇水平”是一个干扰因素,因此将其作为协变量纳入模型中。
SPSSAU-三因素方差分析
三因素方差分析结果
三因素方差分析结果
从上表可知,利用三因素方差分析去研究性别,是否高血压和药物对于胆固醇水平的影响关系,并且将胆固醇水平实验前共1项作为协变量纳入模型中,从上表可以看出:性别没有呈现出显著性(F=2.690,p=0.106>0.05) ,说明性别并不会对胆固醇水平产生差异关系。是否高血压呈现出显著性(F=67.699,p=0.000<0.05) ,说明主效应存在,是否高血压会对胆固醇水平产生差异关系。具体差异可通过方差分析进行具体分析。药物呈现出显著性(F=7.758,p=0.007<0.05) ,说明主效应存在,药物会对胆固醇水平产生差异关系。具体差异可通过方差分析进行具体分析。
② 三因素均值对比
三因素均值对比
另外,如果需要分析交互作用,如果需要分析交互作用,一般只会考虑二阶效应,三阶效应过于复杂通常不会考虑。通常情况下,交互作用分析的前提有两点且两点同时满足前提下才会进行交互作用分析,分别如下:
交互作用的分析是基于自变量呈现出显著性,并且交互项也呈现出显著性的前提下;本案例如果考虑二阶交互作用时,交互项均不会呈现出显著性,如下表:
上表显示,3个2阶交互项均没有呈现出显著性,因而交互作用分析结束。
【提别提示】:
- 是否放入交互项时,即是否考虑到交互作用时,有可能自变量的显著性情况有变化,比如不考虑交互作用时某个自变量呈现出显著性,如果考虑到交互作用时,该自变量却不会呈现出显著性。类似这种情况的原因在于模型变化,而且该自变量可能显著性水平不是特别高所致,可针对实际情况选择最优结果。
- 三因素方差时,有可能涉及到交互作用研究(比如二阶效应或三阶效应),SPSSAU默认不会进行输出,需要主动进行设置;
- 三因素方差时,共有3个X,因此二阶效应共涉及两两组合,一共为3个二阶交互项;
- 三因素方差时,共有3个X,
3个X只会有一个组合,因而会1个三阶交互项;
- 针对X超过3个时,只能直接使用多因素方差分析;
-
X均为定类数据,Y为定量数据。
(4)多因素方差分析
多因素方差分析,通常用于实验研究,如果某个X呈现出显著性,此时可接着使用单因素方差分析或者事后多重比较,继续对比具体差异情况。
多因素方差分析与三因素方差分析类似,此处不再赘述。
二、事后多重比较
(1)事后多重比较
基于方差分析基础上进行;用于分析定类数据与定量数据之间的关系情况。
例如研究人员想知道三组学生(本科以下,本科,本科以上)的智商平均值是否有显著差异。比如分析显示三组学生智商有着明显的差异,那具体是本科以下与本科这两组之间,还是本科以下与本科以上两组之间的差异;即具体两两组别之间的差异对比,则称为事后多重比较;事后多重比较的方法有多种,SPSSAU系统默认使用常见的LSD事后多重比较法。
(2)事后多重比较与‘单独进行事后多重比较’结果不一致?
单独进行事后多重比较(进阶方法->事后多重比较法)时,模型实质上为单因素方差,仅考虑1个X的情况,标准误差的计算并不一致,因此结果会不一致,但通常情况下结论会保持一致;以及此处事后多重比较使用的是边际估计均值(偏最小二乘均值)与一般意义上的平均值有所区别,类似于SPSS软件的EMMEANS功能。
(3)边际估计均值EMMEANS是什么?
在进行事后多重比较时计算的‘均值差值’是基于‘边际估计均值’进行计算,实验研究中,如果为平衡数据,则‘边际估计均值’与平均值完全一样,如果为非平衡数据,‘边际估计均值’为平均值的‘矫正’,其更为科学和准确;通常来看,‘边际估计均值’和平均值应该非常接近,因为它们的测量意义完全一致。
三、简单效应
简单效应指X1在某个水平时,X2不同水平的比较;SPSSAU进行简单效应时默认使用Bonferroni法进行计算p值。
网友评论