美文网首页商业分析
描述统计量数

描述统计量数

作者: dreamhappy2009 | 来源:发表于2017-01-09 21:43 被阅读0次

一、母体与样本

母体:包含针对某一特定决策或调查的所有研究对象

样本:母体的子集

二、位置量数

提供了一个单数值的估计值,这个估计值以某种方式代表着数据集中的“中心”。包括:算术平均数、中位数、众数、中列数

算术平均数(平均值average):母体的平均值用μ来表示,Xˉ为样本均值

中位数(Median):数据从小到大排列时,规定中间数值的位置量数是中位数。

众数(mode.sngl):出现次数最多的那个观测值。

中列数:数据集中最大值与最小值之间的平均值。

三、离散量数

离散:数据的分散程度,也就是说,数据在数值上的分散(或者集中)。描述离散的统计学量数有:全距、方差、标准差

全距:一个数据集内最大数据与最小数据之差。(max-min)

四分位距(IRQ,或者中点分配):第一个四分位数与第三个四分位数之差,Q3-Q1,通常称为四分位距(IQR),也称为中点分配。

方差(Variance):在概率论和统计学中,一个随机变量的方差描述的是它的离散程度,也就是该变量离其期望值的距离。一个实随机变量的方差也称为它的二阶矩或二阶中心动差,恰巧也是它的二阶累积量。

方差越大,意味着以平均值为中心而扩散的数据越多,在观察值中也会出现更多的变异。

母体方差的计算公式为:    (其中Xi是第i项,N是母体中的观察数目,)

样本方差的计算公式为:

标准差:方差的平方根。

母体方差的计算公式为(STDEV.P):

样本方差的计算公式为(STDEV.S):

切比雪夫定理:任意一个数据集中,位于其平均数m个标准差范围内的比例(或部分)总是至少为1-1/㎡,其中m为大于1的任意正数。因此当m=2时,,至少有3/4(或75%)的数据位于平均数2个标准差范围内。当m=3时,至少有8/9(或89%)的数据位于平均数3个标准差范围内。这样的话,我们只要运用计算出来的平均值和标准差,便可以用这些数值来从根本上理解数据集的偏差。

经验规则:(s至标准差)

1,大约68%的观察值将位于距离平均值的1个标准差范围内,或者介于“x拔-s”或“x拔+s”之间。

2,大约95%的观察值将位于距离平均值的2个标准差范围内,或者介于“x拔-2s”或“x拔+2s”之间。

3,大约99.7%的观察值将位于距离平均值的3个标准差范围内,或者介于“x拔-3s”或“x拔+3s”之间。

工序能力指数(cp):表示工序能力对设计的产品规范的保证程度。评价加工工艺系统满足加工技术要求的程度。

cp=(规格上限-规格下限)\总偏差

标准化值(z~分数)(standardize):提供了观察值与平均均值之间的相对的距离测量指标,不受测量单位影响。数据集中的第i个观察值的z分数,公式:

Zi=(Xi-X拔)/s

变异系数(cv):提供了数据中离散程度的相对测量,CV=标准差/平均差

四、形态量数:

偏度:描述了缺乏对称的数据的分布形态

正偏度:分布形态向右侧“缩小”

负偏度:分布形态向左侧“缩小”

偏度系数(cs):测量观察值围绕平均值的不对称程度。

单峰:只有一个峰的直方图成为双峰

双峰:有两个峰的直方图称为双峰

峰度:直方图的尖峰度(即高而窄的形态)或平坦度(即矮而平坦的形态)

峰度系数(ck):测量母体的峰度

公式:

六、分类数据的描述统计量数

比例:正规的统计量数,用p表示。

八、关联量数

协方差:测量两个变量X与Y之间线性关联的量数。

相关:测量X与Y两个变量之间线性关联的量数,它并不取决于测量的单位,相关是通过相关系数来测量的。

相关系数(皮尔森积距相关系数):协方差除以标准差之积。

样本相关系数

九、极端值

极端值:数据中特别大或特别小的值,它们可以使我们从统计分析中获得的结果显著改变。

十、商业决策中的统计思维

统计思维:是一种学习的理念和不断优化的行动,它基于以下这些原因:

1、所有工作都在相互关联的流程组成的一个系统中发生。2、在所有过程中所有,偏差始终存在。3、更优异的绩效,来自于理解和减少偏差。

相关文章

  • 生活中的描述统计学

    这里先介绍两组概念: 描述统计:描绘或总结观察量的基本情况的统计总称。 描述统计学:是研究如何取得反映客观现象的数...

  • 常用分析技术

    描述统计、相关系数、t检验、回归 一、描述统计 统计单变量 平均数(峰度)、标准误差(偏度)、中位数(区域)、众数...

  • 描述统计量数

    一、母体与样本 母体:包含针对某一特定决策或调查的所有研究对象 样本:母体的子集 二、位置量数 提供了一个单数值的...

  • 统计与统计数据

    统计学的两个分支:描述统计和推断统计。 什么是描述统计呢?研究数据收集、整理和描述的统计学方法,包括如何取得所需数...

  • <9>统计学基础知识

    一、描述统计 1.平均数(=avager)、中数(=median)、众数(=mode) 2.分位数(一般都是4分位...

  • 大数据之统计学基础(一) -- 描述统计

    描述统计 1.描述数据水平的统计量 平均数(平均数反映了一组数的平均水平,平均数会受到极端值的影响),在计算时一般...

  • 练习2:亚太地区商学院的发现

    一、各描述统计量 录取名额平均数:165.16 录取名额最大值:463,学校名:Indian Institute ...

  • 商务与经济统计第三章笔记

    描述统计学2:数值方法 1、位置的度量 1)平均数 还有加权平均数和几何平均数 2)中位数 出现异常值的情况下,中...

  • 数据基本感知能力养成

    1.Excel选择加载“数据分析”工具库 2.描述统计字段基本含义: 描述数据集中趋势 (1)平均数(2)中位数:...

  • 第一次作业,分析weatherdata.csv

    数据导入 数据分析 观察数据头部 观察数据的行数和列数 (365, 7) 数据总体信息 数据的描述统计 通过画图观察数据

网友评论

    本文标题:描述统计量数

    本文链接:https://www.haomeiwen.com/subject/ffghbttx.html