用箱线图分析逆江坪学生成绩的离散度,虽然也能找出离散点,但从统计学的角度来看,箱线图一般用于顺序性数据,如优、良、及格与不及格,而学生成绩属于数值型数据,用平均差、方差与标准方差能反映出更多的细节。
1. 众数、中位数与平均数
统计学生成绩,得到如表一的结果。
指标 | 值 |
---|---|
众数 | 96 |
中位数 | 87 |
平均值 | 80.83 |
按照他们的关系平均值<中位数<众数可知,这是一个左偏分布,存在极小值的情形。
2. 直方图
为了验证自己的想法,将学生成绩绘制了直方图,箱体为2,如下:

从图形可以看出,成绩明显属于左偏分布。
3. 偏态系数
利用Excel 2016的“SKEW”函数可以得到SK=-1.17。
SK = -1.17
SK < -1,这说明属于高度偏态分布。
从学生的成绩来看,成绩较差考生的离散度远远比想象还要严重。
4. 其他指标
指标 | 值 |
---|---|
中位数 | 87.00 |
众数 | 96.00 |
峰态系数 | 0.75 |
偏态系数 | -1.17 |
平均值 | 80.83 |
极差 | 68.00 |
平均差 | 13.03 |
方差 | 260.11 |
标准差 | 16.25 |
离散系数 | 1.25 |
5. 离散系数
离线系数又称变异系数,是一组数据的标准差与其相应的平均数之比,计算公式为:
离散系数 = 标准差/平均值
以离散系数为基础,所有数据分布在C1:C69,进行切比雪夫不等式的验证:
COUNTIFS(C1:C69, "<2", C1:C69, ">-2")/69 = 0.96
远远大于75%,完全证明了分布形态的数据至少有(1 - 1/k*k)落在k个标准差之内。
网友评论