美文网首页
2022-08-14我们该怎么认识大数定律

2022-08-14我们该怎么认识大数定律

作者: 书童寒不冷 | 来源:发表于2022-08-14 23:51 被阅读0次

    在我们认知地图里面有一个定律非常的重要,可以给我们的生活很多有价值的指导,它就是大数定律。这个大数定律也是现代统计学之所以是科学的基础,今天咱们就聊聊这个大数定律。

    1.什么是大数定律

    “大数定律”,是说只要一件事情发生的次数足够多,它出现某一个结果的频率,就会等于概率。正因为有大数定律,我们才可以对事物发生的频率做出判断,我们才能通过频率去推测理论上的概率。如果没有大数定律,所有的随机实验、一切通过统计发现事物背后规律的努力,就将变得没有意义。大数定律又被称为“黄金定理”,它让我们真正能用整体的确定性来对抗局部的随机性。

    大数定律是由雅各布·伯努利花了20年的时间,基本证明了这个“不言自明”或者说“显而易见”的结论,之所以说他基本上证明了,是因为他职证明了随着试验的数量越多,频率接近真实概率的可能性越大。他没完成的部分,由前苏联数学家、概率论的先驱柯尔莫哥洛夫在雅各布的基础上,做出了更加严密的证明。

    2. 现实中的数据都是局部数据

    大数据定律想要真正起作用有个限制条件,只有在数据无限的情况下,随机事件发生的频率才等于它的概率,试验次数无限是个数学概念,现实中不可能有无限存在的。当数据量很少的时候,一件事发生的频率可能和它的真实概率相差很大。

    比如如果你有一个完美的硬币,你抛硬币得到正面朝上的概率,就是严格的50%。可是在实际操作之中,你抛 10 次,可能得到 3 次正面,7 次反面。为什么正面向上不是50%呢?大数定律说那是因为你抛的次数不够多,如果你抛一万次,得到正面的频率就会非常接近50%。

    再比如,历史上英国和法国曾经共同研制了一款超音速客机,叫“协和式客机”,1976年投入使用,协和式客机不仅拥有当时最高级别的安全设计,还有当时最高级别的安全保障,在长达24年的飞行中,它没有发生过一起致死事故,一度被认为是世界最安全的飞机。直到2000年7月25日,协和式客机出现了一次坠机事故,协和式客机总共飞行了八万多次,就是因为这一次坠机事故,它的致死事故率立即从24年来的0上升到了八万分之一,变成了世界上最危险的飞机,后来这款飞机就被停飞了。

    这款飞机真的这么不安全吗,其实不一定,因为协和式客机的飞行数据太少了,只有区区八万次,它出事故的频率和真实的事故率之间,可能有很大的误差。而这个误差到底有多大呢?那次失事是意外,还是飞机的设计真的有缺陷?八万分之一的致死事故率到底比真实概率大,还是比真实概率小?这些我们都无法知道,因为没办法让协和式飞机再飞一亿次了。

    3.大数定律和“均值回归”

    均值回归的意思是说,如果一个数据和它的正常状态偏差很大,那么它向正常状态回归的概率就会变大。大数定律不会对已经发生的情况进行补偿,而是利用大量的正常数据,削弱那部分异常数据的影响。正常数据越多,异常数据的影响就越小,直到小到可以忽略不计。打个比方,把一勺糖放在一杯水里,你会觉得很甜,可是放到大海里味道几乎不会有任何改变。就像网上的段子说的五块钱的玛莎拉蒂跑车的优惠券一样。

    比如说一位企业家非常厉害,又有钱又有名,可是他的孩子却没有他那么厉害,是个很普通的人,这个现象就是回归均值。

    为什么会回归均值?不是说这个企业家把他家族的运气都给花光了、妨碍了他儿子的发展,也不是说什么冥冥之中自有天意,要求一个家庭不能把风光占尽—— 这纯粹是一个数学现象,根本原因仅仅是厉害人物的养成需要很好的运气配合,而好运气没有那么容易发生!

    明白了这个道理,再去审视我们的生活,很多现象就好理解了。比如我们经常会说一些俗语,运气不好的时候,会说“三十年河东,三十年河西”;打牌或者玩游戏连着输的时候,会说“否极泰来”。极度的坏运气过后不一定就有好运气,而是通过均值回归,让运气回到不那么坏的正常状态。

    参考资料:

    得到app《刘嘉·概率论22讲》《吴军·数学通识50讲》《万维钢·精英日课》。

    (关注、点赞、转发)(全网同名,书童寒不冷)

    相关文章

      网友评论

          本文标题:2022-08-14我们该怎么认识大数定律

          本文链接:https://www.haomeiwen.com/subject/ywlkgrtx.html