方差单位和数据的单位不一致,没法使用。标准差和数据的单位一致,使用起来方便。
1. 标准差有啥用?
在描述统计学历四分位数的优点是可以从整体上描述出数据的分布状态,却无法告诉我们数据的波动性有多大。
举个栗子,在NBA中,平均数据用来衡量一个球员的战斗力,比如场均得分,盖帽,抢断,助攻等。
那么我们现在想一个问题。如果你是教练,你想知道哪位球员发挥最稳定。因为你需要一支值得信赖的球员队伍,他最不想要的就是表现时好时坏,水平反复无常,波动很大的队员。他需要的是分高,且发挥稳定的球员。
而标准差就是为了描述数据集的波动大小
而发明的。
2. 什么是数据的波动大小?
很多统计概率的书本上会用离散程度和变异大小来表示数据集之间偏离平均值的程度。
“波动大小” 可以用来代替 “离散程度”。
例如日常看新闻,会看腾讯2017年一季度盈利145亿,比去年同期增长57%,也就是每天赚1.6亿,你会惊叹腾讯股价的波动性好大。
想想王健林早上说定个小目标,马化腾下班就完成了。
所以以后遇到“离散程度”,“变异性”这些词理解不了的时候,你的大脑自动切换到“波动大小”这四个字,就理解了。
3. 标准差表示数据集的波动大小,那如何计算标准差?
解释下上面的图,假设数据集中有三个数,分别是x1,x2,x3.
第一步,先计算方差,每个数值减去平均数μ(miu)的平方,相加,然后除以数据集总数n,这里n = 3。这样即可算出每个数值与均值的平均距离。
第二步,方差开方就是标准差(sigma)。
网友评论