美文网首页厚书读博
《商务经济与统计技术》描述数据部分笔记

《商务经济与统计技术》描述数据部分笔记

作者: 蔬香四溢 | 来源:发表于2019-01-08 13:18 被阅读0次

   描述数据用于描述已经发生的事情,通常从数据的频率分布、集中趋势和离散性来描述。以下会总结相关的公式以及作用。

1.频数分布与图形表示

1.1频数分布

频数分布:把一组数据分列到互补包含的组里,以显示各组中观察值的个数。构造频数分布的步骤和方法如下:

构造频数分布的步骤和方法( 组中值:又称组记,相邻两个组下限的中值;组距:相邻两个组中值的差 )

1.2茎叶图

茎叶图可以解决频数分布的弊端,解决频数分布无法知道数据的真实值、不知频数如何分布、只知道数据的大概分布范围的问题。

茎叶图:表现一组数据的统计方法。每一个数值被分成两部分,领头的数字作为茎,尾随的数字作为叶。茎沿竖直轴线排列,叶沿水平轴线排列。

茎叶图案例

1.3其他图形

·直方图

·频数折线图(连接组中值与组频交点的线段,比直方图的优势是:可以多组频数折现进行对比)

·累积频数分布图

2.集中趋势的度量

用于描述一组数据集中程度,它通常是一个单一数值,位于所有数据的中心。常用的工具和公式如下:

集中趋势度量工具 频数分组中集中趋势的度量工具

3.离散性

3.1常用工具和方法

当均值等集中趋势度量无法描述离散大的数据时,而离散程度的度量可以被用于评价两个或多个平均数的可靠性,此时需要对数据的离散程度进行描述,常用工具和方法如下:

图1 图2

3.2标准差的解释和使用

a解释:标准差常用来对两组或多组观测值比较时的一种度量尺度。标准差越小表明数据的离散程度越小,数据分布越紧密。

b切比雷夫定理

对于任意一组观测值(样本或总体),分布在均值加减k倍标准差范围内的值比例至少为1-1/k²,其中k是任意一个大于1的值。

c经验法则

对于对称的钟形频数分布,大约68%的观察值将分布在均值加减1倍标准差之间;大约95%的观察值将分布在均值加减2倍标准差之间;几乎全部(99.7%)的观察值分布在均值加减3倍标准差之间。

d相对离散

当对比数据具有不同单位(如美元和矿工天数);数据具有相同单位,但均值相差甚远(如高层管理人员的收入与非技术性员工的收入),以上两种情况下,多使用cv变异系数衡量离散性。

CV变异系数

CV变异系数标准差与算术均值的比率,表示一个百分数。值越大表示离散程度越大。

e偏度

一组数据的另一个特征就是形状,通常观察到的形状有4类:对称的,正偏的(右偏),负偏(左偏)的以及双峰的,我们用皮尔逊偏度系数来描述偏度:

皮尔逊偏度系数

sk=0,分布对称,没有显现出任何的偏斜性。sk为负为负偏,为正为正偏。

计算机输出的偏度系数如下:

计算机输出的偏度系数

其中右侧标准化,表示标准差除以各个观察值与均值之间的离差。公式表达的意思为每一单位标准差下的各观察值与均值的离差大小,如果这一离差是正的,该特定值大于均值(正偏);如果这一值为负,则该特定值小于均值(负偏);为0,该特定值等于均值(对称)。

相关文章

  • 《商务经济与统计技术》描述数据部分笔记

    描述数据用于描述已经发生的事情,通常从数据的频率分布、集中趋势和离散性来描述。以下会总结相关的公式以及作用。 1...

  • 《商务与经济统计》笔记

    CHAP5 离散型概率分布 5.4 二元分布,协方差和金融资产组合 1) 协方差的计算 numpy.cov() 5...

  • 非参数方法

    本文来自《商务与经济统计》第18章的个人笔记。 什么是非参数方法 参数方法:即对数据的参数有一些先验经验,比如数据...

  • 统计学笔记0:前言

    学点统计知识,别来无恙。主要教材是《商务与经济统计》,笔记引用内容无做商业用途。还是Markdown舒服。

  • 《商务与经济统计》笔记5

    离散型概率分布 1、随机变量 是对一个试验结果的数值描述。随机变量根据取值可分为离散型或连续型。 2、离散型概率分...

  • 《商务与经济统计》笔记(三)

    描述统计学2:数值方法 关键术语 样本统计量:用老对样本进行综合度量的数值(如样本平均数,样本方差和样本标准差 s...

  • 《商务与经济统计》笔记(一)

    数据与统计资料 1、数据的组成 个体:数据的实体,通常为列标签 变量:个体的特征 观测值:测量值集合,通常为行数据...

  • 《商务与经济统计》笔记(二)

    描述统计学2:表格法和图形法 关键术语 数据可视化(data visualization):用于描述汇总和表述一个...

  • 时间序列分析及预测

    本文是《商务与经济统计》一书的笔记。 时间序列的模式 水平模式 数据围绕一个不变的均值上下波动平稳时间序列定义:数...

  • 商务与经济统计

    回顾实践中的统计: 总体、样本和推断 数据的收集方法和数据类型 评估统计调查的道德性 在统计学中,统计数据主要可分...

网友评论

    本文标题:《商务经济与统计技术》描述数据部分笔记

    本文链接:https://www.haomeiwen.com/subject/cspvrqtx.html