离散性 除了了解哪一个分数最能代表整个数据分布外,了解这种集中趋势度量的代表性究竟如何也是很有用处的。其他分数大部分距离它很近还是非常分散?离散性的度量(measures of variability)是描述围绕在集中趋势度量周围的分数分布情况的统计量。
你能看出为什么离散性的度量非常重要吗?举个例子有助于说明这一点。假定你是一名小学教师。现在是一学年的开始,你将教30名小学生阅读。了解到班上的孩子一般能够阅读一年级水平的课本,这将有助于你安排自己的课程。不过,如果你还了解这30个孩子阅读能力的相似或差异程度的话,你就可以安排得更好。他们是否处在同一个水平上呢(低离散性)?如果是这样的话,那么你就可以安排一门很标准的二年级课程。但如果有一些孩子能够阅读更深的材料而其他人却几乎看不懂(高离散性)的话,该怎么办呢?平均水平现在已经不能够代表整个班级的情况,因此你需要安排多种课程以满足这些孩子的不同需要。
关于离散性的最简单度量是全距(range),即频次分布中最高值与最低值之间的差值。对于突然杀人犯的性别角色得分来说,全距是90:(+61)-(-29)。过控得分的全距则是10:(+19)-(+9)。在计算全距时,我们只需要知道两个数值:最高值和最低值。
全距易于计算,但心理学家常常更喜欢用那些更敏感的度量,能将所有数据都考虑进来而不是只考虑极端数值。一个普遍使用的度量是标准差(standard deviation,SD),它代表着所有分数与其平均数之间的平均差值。要计算标准差,我们需要知道数据的平均值和各个分数。一般的步骤是先用各个分数减去均值,然后再确定出这些离均差的平均值。公式如下:
网友评论