指标名称 | 值 | 指标说明 |
---|---|---|
平均 | 81.90 | 算术平均值 |
标准误差 | 1.02 | 衡量样本均值和总体均值的差距,值越小,样本越能代表总体 |
中位数 | 85.00 | 从小到大排序后,最中间位置的数。典型的位置平均数 |
众数 | 80.00 | 出现最多的数值 |
标准差 | 9.14 | 反应数据集的离散程度。值越小,说明分布在平均值附近,则均值代表性越好。 |
方差 | 83.51 | 标准差的平方。也是衡量样本波动大小的指标 |
峰度 | 0.71 | 峰度取值范围[1,+♾),完全服从正态分布的数据峰度值为3,值越大,分布图越高尖,反之越小越矮胖 |
偏度 | -0.92 | 负偏度,数据比较集中在右侧,左侧有长尾,也称左偏。(扩展:正偏度,数据比较集中在左侧,右侧有长尾,也称为右偏) |
区域 | 42.00 | 值的跨度,即最大值-最小值的差 |
最小值 | 54.00 | 区域内的最小值 |
最大值 | 96.00 | 区域内的最大值 |
求和 | 6552.00 | 该列区域内数据加和总数 |
观测数 | 80.00 | 数据量的条数,不计空值 |
置信度(95.0%) | 2.03 | 95%确定总体的真实均值范围(置信区间)是[81.9-2.03,81.9+2.03] 平均值加减此值。 |
什么是置信度?什么是置信区间?
知乎的解释:置信度confidence (可靠度,置信系数,置信水平):抽样目的是用已知的样本指标去探索未知的总体指标。 由于样本的随机性,结论不能完全代表总体,但在一定程度上能代表总体,对这个“一定程度”的量化就是置信度。
百度百科:在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数测量值的可信程度范围,即前面所要求的“一定概率”。这个概率被称为置信水平。
我的理解:数据统计做的最多的事情就是 有样本 推出 总体。但数学家们会思考,怎么让样本数据就可以以偏概全了全部数据呢?于是他们就发明了置信度,用这个数字来衡量样本数据的结论以偏概全解释全部数据的结论究竟可不可信,可信度是多少,这就是置信度。一般置信度95%,就是可以以偏概全了。95%的置信度可以推出一个置信区间。即均值的真实范围在这个区间的概率为95%。
网友评论