美文网首页
数据描述性统计

数据描述性统计

作者: 谈文说理 | 来源:发表于2018-12-10 16:24 被阅读0次

一、集中趋势

1、众数,样本中出现次数(频数)最多的数值。

2、中位数,一组样本数据按升序或降序排列后,如果样本容量为奇数,取中间位置的数值;如果为偶数,则取中间两个数据的平均值。

3、平均数

算术平均数:\frac{1}{n} \sum_{i=1}^nx_{i} n个数据相加后除以n,它较中位数、众数更少受到随机因素影响, 缺点是它更容易受到极端值影响。

几何平均数:\sqrt[n]{\prod_{i=1}^n x_{i} } n个数据相乘后开n次方,适用于指数增长 (恒定的比例增长) 和变化的增长值。

调和平均数:\frac{n}{\sum_{i=1}^n \frac{1}{x_{i} } }n个数据的倒数取算术平均,再取倒数,调和平均数可以用在相同距离但速度不同时,平均速度的计算。

二、离散程度

1、异众比率,总体中非众数次数与总体全部次数之比。

2、四分位差,上四分位数和下四分位数的差值,反映了中间50%数据的离散程度,其数值越小,说明中间的数据越集中;其数值越大,说明中间的数据越分散。

3、描述统计中的方差,\sigma ^2 = \frac{\sum_{i=1}^n (x_{i} -\mu)^2}{n} ,随机变量的离散程度,将各个误差将之平方相加之后再除以总数,开根号之后就是均方差(标准差)。

4、概率分布中的方差,随机变量X的均值就是数学期望E,即

6、离散系数(变异系数),标准差\sigma 与平均值\mu 之比。

三、分布形状

1、偏态系数,用来度量分布是否对称,S = E[(\frac{X-\mu }{\sigma })^3  ] = \frac{\mu ^3 }{\sigma ^3} ,当SK>0,数据为正(右)偏态,当SK<0,数据为负(左)偏态,当SK=0,数据完全对称。

2、峰态系数,用来度量数据在中心聚集程度,在正态分布情况下,峰度系数值是3(但是SPSS中将正态分布峰度值定为0,是因为已经减去3,这样比较起来方便)。峰度系数与其标准误的比值用来检验正态性。如果该比值绝对值大于2,将拒绝正态性。

相关文章

  • 小数据| 描述性统计(Python/R 实现)

    描述性统计 描述性统计是借助图表或者总结性的数值来描述数据的统计手段。数据挖掘工作的数据分析阶段,可以借助描述性统...

  • 【数据分析师必备】九大常用数据分析方法汇总(上)

    一、描述性统计 定义:描述性统计是一类统计方法的汇总,揭示了调查总体的数据分布特性。描述性统计分析要对调查总体所有...

  • R语言学习(六)基本统计分析--上

    整体数据计算描述性统计量 summary()函数 可以使用summary()函数来获取描述性统计量 可以看出sum...

  • 三、数据探索方法及函数汇总(Python描述)

    1 描述性统计 四个方面:数据的中心趋势、相对位置、离散度、相关性; 两种方式:统计量和统计图![描述性统计内容大...

  • SPSS基本统计分析

    描述性统计分析 描述性统计分析可以对数据进行基本描述,例如:平均值、众数、中位数、方差、总数。 频数分析,对数据进...

  • 数理统计

    描述性统计:平均值/标准差/中位数描述性统计是指运用制表和分类,图形以及计算概括性数据来描述数据特征的各项活动。描...

  • 数据探索之参数估计

    统计学有两大主要分支,分别是描述性统计学和推断统计学。描述性统计学用于描述和概括数据的特征以及绘制各类统计图表。总...

  • 数据描述性统计

    一、集中趋势 1、众数,样本中出现次数(频数)最多的数值。 2、中位数,一组样本数据按升序或降序排列后,如果样本容...

  • 面试工程体系篇

    1、数据简单查看参考 1.1、 查看数据描述性统计:describe() 1.2、 查看数据字段名:columns...

  • Python描述性统计

    1、学习工具安装 Python、pandas、numpy环境安装; 2、数据的描述性统计

网友评论

      本文标题:数据描述性统计

      本文链接:https://www.haomeiwen.com/subject/xtnlhqtx.html