美文网首页数据科学研究中心
数据分析|标准差与方差使用上有哪些区别?

数据分析|标准差与方差使用上有哪些区别?

作者: 雷克斯 | 来源:发表于2021-07-06 23:22 被阅读0次

方差


我们还是来举例说明什么是方差。

假设小明期末考试考了6门课,他的成绩分别是60,78,77,90,92,83。那么小明成绩的方差该怎么算呢?

我们需要先算出小明的平均成绩:\frac{(60+78+77+90+92+83)}{6}=80

然后,分别用小明每一门课的成绩减去平均成绩,求出差的平方,再算出这些平方的平均值。即
\frac{[(60-80)^2+(78-80)^2+(77-80)^2+(90-80)^2+(92-80)^2+(83-80)^2]}{6}=111

我们把这个结果就叫做方差。把它一般化, 假设有x_1、x_2...x_n一共n个数据,它们的均值是μ,那么方差就可以表示为:
\sum_{i=1}^n{\frac{(x_i - \mu)^2}{n}}

有时候分母的n也会换成n-1,取决于它是样本数据还是整体数据,不过对我们的结果影响不大。

那么方差有什么意义呢?它所表示的是数据的波动程度,更具体的说,它表示的是数据与均值之间的离散程度。方差越大,表明数据越分散,离均值的平均距离远;方差越小,表明数据大多集中在均值周围。

标准差


标准差就是方差开方得到的结果,即

\sqrt{\sum_{i=1}^n{\frac{(x_i - \mu)^2}{n}}}

那这么做有什么意义呢?注意到,我们的方差是求了平方的,如果我们的数据是有单位的话,最后的结果将是单位的平方,对这个结果不是很好解释。比如上面小明成绩的方差是111,单位是“分”的平方。我们就会感到很奇怪。

将方差开方后,单位就变成了原来的单位,那么结果就很好解释了。可以得出,小明成绩的标准差约为10.5分。也就是说,小明的成绩与均值的差距平均在10.5分。

标准差同样衡量数据的波动状况,只不过它的结果很好解释。

总结


方差与标准差同样用来描述数据的离散程度,由于方差较标准差少了一次开方的运算,所以如果只是用来比较离散程度的情况下,我们可以直接使用方差。但由于方差是平方后的结果,所以在单位上与原来数据单位不一致,并不能直接进行运算。比如假设希望用样本的离散程度来圈定一个合理值范围的时候,就需要使用标准差参与计算。

好了,这就是今天的全部内容,欢迎大家留言讨论。

相关文章

网友评论

    本文标题:数据分析|标准差与方差使用上有哪些区别?

    本文链接:https://www.haomeiwen.com/subject/rzynultx.html