样本标准差

作者: 看远方的星 | 来源:发表于2020-10-11 20:51 被阅读0次

样本标准差
统计学笔记5 置信区间
期望方差
统计学的公式总结
MATLAB 样本标准差与标准差
Pandas计算标准差
2019-10-03分析测试统计学方法-正态分布表征
《商务与经济统计》笔记（三）
15、标准差
【statistics】描述数据的方法

标准差描述数据的波动性（离散程度，变异性）大小，标准差越小波动越小，较稳定。

样本标准差为什么除以n-1？

当你选择一个样本后，相比总体，你拥有数据的数量是变少了，因此，与总体中的数值偏离平均值的程度相比，样本中很有可能把较为极端的数值排除在外，这样使得数值更有可能以更紧密的方式聚集在均值周围。也就是说，样本的标准差要小于总体标准差。

所以，为了更好的用样本估计总体的标准差，统计学家就将标准差的公式做了改造：即原来的标准差公式是除以n，为了用样本估计总体标准差，现在是除以n-1。这样就使得标准差略大。弥补了样本的标准差小于总体标准差的不足。

所以很多书上会直接把除以n-1的标准差叫做样本标准，其实这个样本标准差的目的是用于估计总体标准差。

也可以从自由度的角度理解，但是本质都是为了更加接近总体标准差。

我什么时候标准差除以n还是n-1呢？

只要你记住使用标准差的目的是什么，就不会搞错了。
如果你只是想计算一个数据集的标准差，那么就除以n。例如你有100个毕业与清华人的收入，只是想了解这100个人构成的数据集的波动大小，那你就用除以n的标准差公式。
如果你想用样本来估计总体的标准差，那就用除以n-1的标准差公式。例如你想把刚才例子中这100个人当成一个样本，用这个样本来估计出总体（所有毕业与清华人的收入）的标准差，那么就除以n-1的标准差公式。

样本方差是总体方差的无偏估计，但样本标准差却不是总体标准差的无偏估计，而是一个稍有偏的估计。

在基础统计文章中，但凡用到总体标准差的时候，都用样本标准差直接替代总体标准差，这是有误差的，只不过样本容量大时，这个误差可以忽略不计。

参考文章：
https://zhuanlan.zhihu.com/p/49187090
https://www.zhihu.com/question/27276029