讲完了关于人建模的关键,我们再说三种分布模型的特点。如果说分布可能有点听不懂,但是你应该听说过各国的人均寿命是多少,人均GDP是多少,里面运用了正态分布模型。
对于明星高收入说明,畅销产品总是赚走了大部分钱,这些都需要幂率分布模型去解释。
正态分布模型
关于正态分布既是一个概率分布也是范围分布。
正态分布第一个表现就是描述均值。2017年,美国的人均国内生产总值为57000美元,远超法国的42000美元,但是法国人的平均预期寿命则比美国人高出3年。
而第二个表现就是描述范围,就好像贫富差距一样,大多数都是正常收入,两段的富人和穷人都是少数的,正常收入总是最多的,这告诉我们哪有那么多一夜暴富,其实大多数过得都是平常人的日子。
其实非常多的现象都表现为正态分布:动物和植物的体型大小,学生在考试中的成绩,便利店每天的销售额,海胆的寿命。
可是为什么都符合正态分布,其实只要群体是独立造成结果且不会超出范围,这样一般符合正态分布。
就比如成绩你很难超过自己的能力上限也不会低于下限,它是你能力的表示,这个时候一群人相加求均值就可以得到正态分布。
正态分布描述平常人平常事,而极端事件该怎么描述呢!
对数正态分布
只要我们的事情不是相加,而是相乘的话那么事情会变得极端起来。
比如说涨工资吧。有个公司,本来员工之间工资相差不大。有一天老板宣布了一个涨工资计划,说以后每年业绩突出的员工,工资会增加 10%。你猜这个政策意味着什么?
意味着员工之间的工资差距将会变得越来越大。可能老王工资本来就比小李高,这次业绩又比小李好,那么老王涨 10%,小李没有,所以两人的差距将会变大。换一种情况,老王表现没有小李好,那么小李涨 10%,两人差距会缩小。但是,请注意,因为老王工资高,所以第一种情况导致的工资差距拉大,会超过第二种情况导致的工资差距缩小 —— 所以总体看来,全体员工的收入差距必然拉大。
这就是因为你使用了相乘的方法。换个方案,如果规定业绩好的员工,不论之前的工资是多少,一律涨一万块钱,那么员工之间的工资差距就不会拉大。
请注意,对数正态分布仍然假设每个随机变量的作用是互相独立的,就是说我只计算当前相乘的事件。可是事件连续相乘就不是对数分布叫做幂率分布。
幂率分布
幂率分布就更加极端就比如95%表述是对数正态分布而99.99%那就是幂率分布。
幂率分布是有相关性的随机变量组成,科学家找到了很多个能带来幂律分布的模型,咱们这里说其中最常见的两个。
第一个模型马太效应,人们喜欢跟随潮流,什么明星越有名越多人喜欢,越多人喜欢就越有名,最有名的几个明星片酬几千万,而普通明星可能刚够养活自己。
就像淘宝,拼多多,微信,支付宝,抖音,这些占据普通人的手机,也是千亿级体量,在它们各自领域里面可能千万级的都少,根本不是对手。
比如一个城市越大,其中人与人的互动就越多,就业机会和创新机会也会越多,就越能吸引到新人的加入。这就是为什么中国有那么多的超大城市。
另一种幂律分布模型来自于复杂系统的“自组织”现象。假设树木可以在一个二维网格上生长,这些树木也可能会随机地被闪电击中。当树木的密度较低时,由闪电引发的任何火灾的规模都很小,最多只会蔓延到几个格点。当树木密度变得足够高时,再被闪电击中就会导致森林大火。如果密度超过了阈值,那么任何火灾都会毁掉整个森林。因此,树木密度自组织地达到了一个临界状态。
就像三体里面那个叶文洁,向三体人发送自己族群的位置,导致三体人的全面进攻,社会过于复杂导致一个个体的摧毁行为就能危及整个族群。
网友评论