美文网首页
3.1 变量的水平度量

3.1 变量的水平度量

作者: 迪丽娜扎 | 来源:发表于2019-06-05 18:06 被阅读0次

所谓水平度量,就是衡量变量取值的大小

(插播一句:既然都能衡量大小了,变量肯定是数值变量,而不是类别变量,或者说对类别变量进行水平度量是没有意义的)

具体的度量方式有:

1. 平均数。

1.1 平均数就不用说了

1.2 加权平均数:把原始数据分为k组,每组的元素个数还不一样(不同频数),使用每组的中位数作为该组的值,中位数乘以频数然后所有组加和然后再除以总样本数,就叫加权平均数了。感觉没什么卵用。

2. 分位数

2.1 中位数:把所有的数按大小顺序排列,中间位置的数就是中位数。(一共奇数个元素的话中间位置就1个数,一共偶数个元素的话就是最中间的两个数的平均值)

2.2 四分位数:中位数是中间位置,四分位数就是25%和75%位置的数。当不是恰好是整数位置时,有个按比例均摊的机制,比如第3.3个数应该是由 第3个数*0.7 + 第4个数*0.3 得来。

2.3 百分位数:类似的概念。Python的numpy.percentile函数已经把这些操作全封装好了。

3. 众数

出现次数最多的值,一般来说针对离散型变量才有意义。

4. 各度量方式的特点

平均数:直观度量了特征的大小情况、会受异常值影响、若原始特征为偏态分布则平均数的表达有限

分位数或众数:能表达的信息不如平均数多,但比较稳健,不受异常值或偏态分布的影响。

综上:若数据较正态时,用平均数;若数据比较偏态,则用分位数或众数。实际中分位数或众数应用应该更多,因为现实中没有那么多正态分布~~~

相关文章

  • 3.1 变量的水平度量

    所谓水平度量,就是衡量变量取值的大小。 (插播一句:既然都能衡量大小了,变量肯定是数值变量,而不是类别变量,或者说...

  • 3.3 变量分布形状的度量

    3.1总结了变量水平度量,包括平均值、分位数、众数等概念,3.2部分总结了变量的差异性度量,包括方差、标准差、离散...

  • 3.2 变量的差异度量

    变量的水平度量是度量大小,差异度量则是指度量变量的跨度、离散程度等~有以下指标或概念: 1. 极差:最大值-最小值...

  • 23 coreldraw学习笔记-度量工具

    度量工具组有五个工具选项。平行度量,水平和垂直度量,角度量,线段度量,3点标注。 一、平行度量工具 用法:单击一个...

  • kettle环境变量的设置和获取

    变量的类型Kettle 的早期版本中的变量只有系统环境变量目前版本中(3.1) 变量包括系统环境变量, "Kett...

  • 商务与经济统计学 第三章 描述统计学II:数值方法(上)

    3.1 位置的度量 因为平均数、加权平均数、中位数较为简单,所以不加以更深的论述,着重说一下几何平均数。 3.1....

  • 2018-08-14-Python数据科学第四章

    描述性统计分析与绘图 变量的度量类型 数值型变量 类别型变量 有序 有大小、高低、次序之分...

  • 数据分析学习笔记

    R语言介绍 统计介绍 2.1变量度量类型 名义型变量 等级型变量 连续型变量 等级变量差值无意义,连续变量差值有意...

  • 3.1常量和变量

    在程序的世界中,可以让计算机按照指令做很多事情,如进行数值计算、图像显示、语音对话、视频播放、天文计算、发送邮...

  • 《JavaScript高级程序设计》(第4版)笔记4

    第三章 语言基础 3.1 语法 3.3 变量 ECMAScript变量是松散类型的,意思是变量可以用于保存任何类型...

网友评论

      本文标题:3.1 变量的水平度量

      本文链接:https://www.haomeiwen.com/subject/ommsxctx.html