美文网首页
我又来写垃圾文章之数据的描述性度量

我又来写垃圾文章之数据的描述性度量

作者: echolvan | 来源:发表于2020-04-27 10:46 被阅读0次

相对位置的度量:标准分数(标准化的值)

  • 它是对某一个值在一组数据中相对位置的度量
  • 可以用来判断一组数据中的离群点(比如3西塔准则)
  • 计算公式为 z_i = \frac{x_i - \overline{x}}{s}, 其中s为标准差

当然标准差的作用大家也明白了3-sigma法则又称经验法则,加减一倍标准差,数据分布的概率,两倍标准差,三倍标准差。。。但是这个前提条件是正太分布的,以均值为对称的对称数据。

切比雪夫不等式

  • 对于对称数据我们可以用经验法则,但是对于不是对称的数据呢,我们可以使用切比雪夫不等式,它对任何分布形状的数据都适用
  • 切比雪夫不等式提供的是概率下界,也就是说它指出“所占的比例至少是多少”
  • 对于任何分布形态的数据,根据切比雪夫不等式,至少有1-1/k^2的数据落在平均数加减k个标准差之内。其中k是大于1的任意值,但不一定是整数
    所以对于k=2,3,4的意义,当k为2时,至少有75%的数据落在平均数加减2倍标准差内,当k为3时,至少有89%的数据落在平均数加减3个标准差的范围之内。

相对离散程度:离散系数

  • 标准差与其相应的均值之比
  • 对数据相对离散程度的测度
  • 消除数据水平高低和计量单位的影响
  • 用于对不同组别数据离散程度的比较
  • 计算公式V_s = \frac{S} {\overline{X}}

偏态与峰度的度量

数据分布的偏斜程度的测度

  • 偏态系数=0为对称分布
  • 偏态系数>0为右偏分布
  • 偏态系数<0为左偏分布
  • 偏态系数大于1或小于-1被称为高度偏态分布,偏态系数在0.5~1或-1到-0.5之间则任务是中等偏态分布,偏态系数越接近0,偏斜程度越低

峰度系数

  1. 数据分布扁平程度的测度
  2. 峰度系数=0扁平峰度适中
  3. 峰度系数<0为扁平分布
  4. 峰度系数>0为尖峰分布
  5. 峰度系数同样去了量纲

相关文章

  • 我又来写垃圾文章之数据的描述性度量

    相对位置的度量:标准分数(标准化的值) 它是对某一个值在一组数据中相对位置的度量 可以用来判断一组数据中的离群点(...

  • 统计学第二周——数据的描述性统计

    参考:.统计学第七版-第4章数据的概括性度量; 本周的主要学习内容是数据的描述性统计,本文主要从以下三个方面来进行...

  • 数据的描述性分析:概括性度量

    水平的描述 平均数(mean)也称为均值,常用的统计量之一。消除了观测值的随机波动,但易受极端值的影响。根据总体数...

  • 小数据| 描述性统计(Python/R 实现)

    描述性统计 描述性统计是借助图表或者总结性的数值来描述数据的统计手段。数据挖掘工作的数据分析阶段,可以借助描述性统...

  • 《用户体验度量》 数据芝士——描述性统计

    摘自《用户体验度量:收集、分析与呈现》 Tom Tullis Bill Albert 著 周荣刚 秦宪刚 译 描...

  • 数据发现:凭什么登顶富豪榜?

    本文数据来自:2018福布斯中国400富豪榜 文章纲目: 1.数据的描述性统计 2018福布斯中国前10;财富数据...

  • 2018-08-14-Python数据科学第四章

    描述性统计分析与绘图 变量的度量类型 数值型变量 类别型变量 有序 有大小、高低、次序之分...

  • 态度,要有态度

    何为态度? 做事的状态和度量? 对人的状态和度量? 人之度量!!! 皆凡人之度量,既有私心,人情 褒义贬义? 刑...

  • 数据分析方法

    一、数据分析分类:描述性数据分析、探索性数据分析、验证性数据分析。 1、描述性数据分析:1)对比分析;2)平均分析...

  • 数据挖掘的分类

    数据挖掘可以分为两大类一类为描述性的数据挖掘,另一类为预测性的数据挖掘。其中描述性的数据又分为关联规则,聚类分析,...

网友评论

      本文标题:我又来写垃圾文章之数据的描述性度量

      本文链接:https://www.haomeiwen.com/subject/ixtywhtx.html