最近在学习刘嘉老师的《概率论22讲》,终于弄明白了哪些概率分布是个什么玩意儿。
之前在学习《概率论》这门课的时候,学到概率分布的时候就傻眼了,各种不同的分布,对应着不同的公式,不同的图像,不同的性质......这一大堆复杂的概念,着实让人觉得头大。如果现在去大学里随便抓一个学过概率论的人问他概率分布是什么,估计不太可能可以解释清楚。概率分布模型本应该是我们的好帮手,但现在却如此令人头大的关键就是课本里从来都是各种复杂的公式,很少有实际的应用。
一个人的身高是多少?一个人的财富是多少?一个单词出现的可能性是多少?一个科学家能发表的论文数是多少?你可能觉得世界上很多的数据都是毫无规律,随机的,没有办法预测的。但是现实世界并不像想象中的那样,从上帝视角来看,这些问题的答案是固定的。概率分布就是让人站在上帝视角看世界的工具。事实上,一个人的身高从整体上就是服从正态分布的,就像是一个倒过来的钟:平均身高周围的人很多,但是特别高或者特别矮的人很少。

财富分布,单词出现频率,科学家发表论文数又是服从幂律分布的,也就是我们平常说的二八定律, 20%的人掌握了80%的财富......幂律分布并不像正态分布一样都出大部分的值都在均值附近比较“平均”,幂律分布看起来就非常不均衡。

事实上,像正态分布、幂律分布这样的概率分布模型已经被科学家发现了几十种,但是我们生活中常用到的绝大多数就几种。想象一样,身高、智商、考试分数等这些不同的概念,竟然都可以用正态分布的倒钟曲线画出,财富、论文数、词频、地震灾难等级等竟然都可以用幂律分布的长尾曲线画出,是不是感觉抓住了世界的客观规律,是不是很奇妙?只要对这几种概率分布模型有一个感性的认识,就像是我们口袋里装了几幅上帝的眼镜,对于客观世界的理解也会更加的深刻。
网友评论