标准差
在统计中,标准差是一种用于量化一组数据值的变化或分散程度的度量。一个较大的标准差,代表大部分数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。
Standard_deviation_diagram
深蓝区域是距平均值小于一个标准差之内的数值范围。在正态分布中,此范围占比
率为全部数值之68%。对于正态分布,两个标准差之内(深蓝,蓝)的比率合起来
为95%。对于正态分布,正负三个标准差之内(深蓝,蓝,浅蓝)的比率合起来
为99%
总体标准差计算公式
总体标准差样本标准差计算公式
样本标准差 在Excel中计算方差的公式为STDEV.P和STDEV.S(或STDEV)其中,STDEV.P计算时,认为你给出的数据是总体,因此它的分母为N,而STDEV.S计算时,认为你给出的数据是样本,因此它的分母为N-1。在R中,用到的函数为sd,默认的就是样本,因此分母为N-1。标准误
标准误差,也称标准误,是描述对应的样本统计量抽样分布的离散程度及衡量对应样本统计量抽样误差大小的尺度。对一个总体多次抽样,每次样本大小都为n,那么每个样本都有自己的平均值,这些平均值的标准差叫做标准误差。
标准误计算公式
但由于通常σ为未知,此时可以用研究中取得样本的标准差 (s) 来估计:
标准误与标准差的区别
从上面的描述我们就知道了,标准差与标准误的区别在于:
- 标准差是对一次抽样的原始数据进行计算的,而标准误则是对多次抽样的样本统计量进行计算的(这个统计量可以是均值);
- 标准差只是一个描述性指标,只是描述原始数据的波动情况,而标准误是跟统计推断有关的指标,大多数的统计量计算都需要用到标准误。
最后举个简单的例子:
例如我们要调查地区A中10岁男孩的身高。如果全部都统计下来,直接测是最准确的数据。但是成本高,不现实。因此需要进行采样,一次测量100个男孩的身高,求这一次的均值M1与标准差S1,如果采样10次,每次都取100人,我们会得到10个均值,分别记为M1,M2,M3...M10,对这10个均值再求一个均值M以及标准差S,其中这个标准差S就是标准误(standard error),即均值的标准误差(standard error of mean)。
文章参考:
https://www.jianshu.com/p/b6b87da11c82
https://en.wikipedia.org/wiki/Standard_error
https://en.wikipedia.org/wiki/Standard_deviation
网友评论