今天是2020年11月14日星期六
18/21【24/88】今天是开始习惯养成练习的第539天。
每日一练:
As the t-distribution’s degrees of freedom decrease, the t-distribution most likely:
A exhibits tails that become fatter.
B approaches a standard normal distribution.
C becomes asymmetrically distributed around its mean value
我们总觉得统计学既非常晦涩又跟我们的实际生活脱节,是一门很无聊的学科。其实你可能只是打开它的方式不太对。什么是自由度呢?很多人都是一脸懵逼的。其实吧,自由度就是狼人杀里面,谁可能是狼人的问题。
从游戏最开始来说,是不是每个人都有可能是狼,即使是第一天挂掉的那个人,他也有可能是狼人自刀的,也是不能排除嫌疑的。那么第一天,除了扮演上帝的人之外,其他的人都有可能是狼,那么 12 个人里面就有 11 个人可能是狼。接下来就是大家喜闻乐见的忽悠或者说飙戏环节,大家都在睁着眼说瞎话,因为是编的话大多会露出一些马脚的,你可以根据这些矛盾的话排除掉一些人,那么这个时候这 12 个人里面,你可能已经排除掉了 6 个人了,那么也就是说这 12个人里面现在只有 6 个人可能是狼。
当然接下来,有人跳预言家,有人跳女巫,以及进行投票都可以将狼人的范围缩小。这些条件一叠加,你发现狼人只可能是那四个人,而不会像最开始那样认为有 11 个人都可能是狼。那么这其实就是一个自由度降低的例子。如果没有任何条件限制,那么大家这 12 个人都有可能是狼,但是通过有人做了上帝,大家投票投出去了一些人,那么到最后你不可能还认为 12 个人都可能是狼人的吧,用统计学上的话来说,自由变量就变少了。
那么自由度降低会带来哪些影响呢?比如我们现在统计一下全国成年男性身高,那么肯定是 167cm-175cm 之间的最多,超过 175cm 的以及低于 167cm 的成年男性所占的比率在逐步下降,低于 150cm 或者高于 200cm 的所占的比率就极低了。
大体上是这样一种正态分布,但是在你们家大城市铁岭,数据可能稍稍有些不同,175cm 以上所占的比率要比全国高,反而是 167cm-175cm 之间所占的比率比较低。当然如果我们把人口基数再缩小,缩小到潘长江家族的话,我们会发现150cm-160cm 之间所占的比率最高,167cm-175cm 之间的比率比较低的局面,什么意思呢,随着样本总量也就是自由度的下降,出现极端事件的概率变大,也就是我们统计学上常讲的矮峰肥尾。
A is correct.
A standard normal distribution has tails that approach zero faster than the t-distribution. As degrees of freedom increase, the tails of the t-distribution become less fat and the t-distribution begins to look more like a standard normal distribution. But as degrees of freedom decrease, the tails of the t-distribution become fatter
阮建清
2020-11-14
网友评论