美文网首页
数据描述性统计

数据描述性统计

作者: 谈文说理 | 来源:发表于2018-12-10 16:24 被阅读0次

    一、集中趋势

    1、众数,样本中出现次数(频数)最多的数值。

    2、中位数,一组样本数据按升序或降序排列后,如果样本容量为奇数,取中间位置的数值;如果为偶数,则取中间两个数据的平均值。

    3、平均数

    算术平均数:\frac{1}{n} \sum_{i=1}^nx_{i} n个数据相加后除以n,它较中位数、众数更少受到随机因素影响, 缺点是它更容易受到极端值影响。

    几何平均数:\sqrt[n]{\prod_{i=1}^n x_{i} } n个数据相乘后开n次方,适用于指数增长 (恒定的比例增长) 和变化的增长值。

    调和平均数:\frac{n}{\sum_{i=1}^n \frac{1}{x_{i} } }n个数据的倒数取算术平均,再取倒数,调和平均数可以用在相同距离但速度不同时,平均速度的计算。

    二、离散程度

    1、异众比率,总体中非众数次数与总体全部次数之比。

    2、四分位差,上四分位数和下四分位数的差值,反映了中间50%数据的离散程度,其数值越小,说明中间的数据越集中;其数值越大,说明中间的数据越分散。

    3、描述统计中的方差,\sigma ^2 = \frac{\sum_{i=1}^n (x_{i} -\mu)^2}{n} ,随机变量的离散程度,将各个误差将之平方相加之后再除以总数,开根号之后就是均方差(标准差)。

    4、概率分布中的方差,随机变量X的均值就是数学期望E,即

    6、离散系数(变异系数),标准差\sigma 与平均值\mu 之比。

    三、分布形状

    1、偏态系数,用来度量分布是否对称,S = E[(\frac{X-\mu }{\sigma })^3  ] = \frac{\mu ^3 }{\sigma ^3} ,当SK>0,数据为正(右)偏态,当SK<0,数据为负(左)偏态,当SK=0,数据完全对称。

    2、峰态系数,用来度量数据在中心聚集程度,在正态分布情况下,峰度系数值是3(但是SPSS中将正态分布峰度值定为0,是因为已经减去3,这样比较起来方便)。峰度系数与其标准误的比值用来检验正态性。如果该比值绝对值大于2,将拒绝正态性。

    相关文章

      网友评论

          本文标题:数据描述性统计

          本文链接:https://www.haomeiwen.com/subject/xtnlhqtx.html