一、概念
A、位置量数(以某种方式代表数据集的中心)
1、算数平均数:
![]()
2、中位数:当数据从小到大排列时,位置处于中间位置的数。MEDIAN()
3、众数:出现次数最多的数。MODE.SNGL()。多个众数:MODE.MULT()
4、中列数:数据中最大值和最小值的平均值。
B、离散量数(数据在数值上的分散程度)
3、方差:
1、全距:一个数据集内最大数据和最小数据之差
2、四分位距:Q3-Q1。第一个四分位数与第三个四分位数之差,也称为中点分配。这只包含了中间50%的数据,因此中间50%的数据都在以该差为中心的相对较小范围内集中。
![]()
函数为:VAR.S()
样本方差分母还要减1
注意:方差的单位是平方,是以xx的平方为单位。这使得方差在实际中比较难运用,因此出现了标注差。
4、标准差:![]()
函数:STDEV.S()
5、标准化值:z分数。![]()
STANDARDIZE(x,mean,standard)
6、变异系数(CV):标准差/平均差。当两组数据的测量尺度相差大,或者数据量纲不同,直接用标准差比较不合适,而CV消除了尺度和量纲。
C、形态变量
1、偏度系数:观察值围绕平均值不对称的程度。SKEW()
越接近0,偏斜度越小;
1 or <-1,数值分布高度偏斜
0.5~1 or -0.5~-1,中度偏斜
0.5~-0.5,相对对称
二、EXCEL的描述统计工具
数据→数据分析→描述统计
网友评论