数据服从正态分布是很多分析方法的前提条件,在进行方差分析、回归分析等分析前,首先要对数据的正态性进行分析,确保方法选择正确。如果不满足正态性特质,则需要考虑使用其他方法或对数据进行处理。
检测数据正态性的方法有很多种,以下为几种常见方法:图示法、统计检验法、描述法等。
01. 正态图
正态分布图可直观地展示数据分布情况,并结合正态曲线判断数据是否符合正态分布。
操作方法:SPSSAU→可视化→正态图分析时,选择【正态图】分析方法,拖拽分析项到右侧分析框内,点击“开始正态图分析”即可得到结果。
正态图若数据基本符合正态分布,则会呈现出中间高、两侧低、左右基本对称的“钟形”分布曲线。
若数据为定类数据或数据量较少,一般很难呈现出标准的正态分布,此时建议只要图形呈现出“钟形”也可接受数据服从正态分布。
若数据分布完全偏离正态,则说明数据不符合正态分布。
02. P-P图/Q-Q图
P-P图和Q-Q图,都是通过散点与正态分布的预测直线法重合程度以说明数据是否服从正态分布。
P-P图是将实际数据累积比例作为X轴,将对应正态分布累积比例作为Y轴,作散点图,反映实际累积概率与理论累积概率的符合程度。
Q-Q图将实际数据作为X轴,将对应正态分布分位数作为Y轴,作散点图,反映变量的实际分布与理论分布的符合程度。
如数据服从正态分布,则散点分布应近似呈现为一条对角直线。反之则说明数据非正态。P-P图和Q-Q图的功能一致,使用时没有区别。
03. 正态性检验
利用统计图分析正态性,往往是依靠分析者的主观判断进行。因而容易产生结果偏差。因此需要结合其他方法,对数据的正态性指标进行统计描述。
正态性检验分析定量数据是否具有正态分布特质。
操作步骤:选择【正态性检验】分析方法,拖拽分析项到右侧分析框内,点击“开始正态性检验”即可得到结果。
分析结果如果样本量大于50,则应该使用Kolmogorov-Smirnov检验结果,反之则使用Shapro-Wilk检验的结果。
上图中,样本量为300,因而选择K-S检验。P值=0.149>0.05,说明数据服从正态分布。
04. 描述法
描述法即通过描述数据偏度和峰度系数检验数据的正态性。
偏度和峰度可通过描述性分析得到,也可在正态性检验中直接查看。
理论上讲,标准正态分布偏度和峰度均为0,但现实中数据无法满足标准正态分布,因而如果峰度绝对值小于10并且偏度绝对值小于3,则说明数据虽然不是绝对正态,但基本可接受为正态分布。
其他说明
检验数据正态性的方法有很多,其中统计检验法对于数据的要求最为严格,而实际数据由于样本不足等原因,即使数据总体正态但统计检验出来也显示非正态,实用性上不如图示法直观,接受程度高,因此一般情况下使用图示法相对较多。
当正态图和正态性检验结果出现矛盾,如正态图显示数据分布对称而正态性检验结果P<0.05,此时建议不要追求绝对的正态,如数据基本满足正态性即可接受服从正态分布。
另外,正态性检验要求严格通常无法满足,如果峰度绝对值小于10并且偏度绝对值小于3,则说明数据虽然不是绝对正态,但基本可接受为正态分布。
若想将非正态性数据转化为正态性数据,可将数据取对数、开根号等处理,以接近正态性。
更多干货内容欢迎登陆SPSSAU官网阅读
网友评论