所谓伪随机,就是看上去产生的过程似乎是随机的,但实际上是确定的。例如计算机的随机数,这是通过确定性的算法计算出来的,让你随意想一个数字,这也是根据你个人习惯偏好想出来的,它们都属于伪随机数。也就是说,如果我们选择样本的随机程度不够,或者我们自己对数据的理解程度不够,就经常会出现一些“小确幸”的事情:我们可能会认为幸运和缘分这样的东西,出现的概率还挺高的。
随机对照试验帮助你去伪存真
随机对照试验,现在无论是医疗行业的临床医学、生物科学的基因遗传学,还是互联网黑客增长理论当中的 A/B 测试,都运用到了这个理论。它帮我们解决了一个问题,就是当我们不知道客观世界里一个问题的真正答案的时候,可以通过少量的数据来验证非常大的数据规律。
幸存者偏差就是当取得资讯的渠道仅来自幸存者时,我们得出的结论可能会与实际情况存在偏差。因为这样做看上去结果的确是由随机对照试验产生,但在逻辑上是错误的,这其实是在用结果来倒推整个前期数据的产生过程。
其实,并没有“预言帝”和“赌神”的存在,我们看到的只是大规模数据背后的“幸存者”。
所以我们要验证章鱼保罗能力的话,我们应该从一开始就把它安置在一个没有任何信号干扰的环境里让它连续预测十次,这样它的成功概率是 1%,我们还可以提高预测次数来检测它是不是真的有那么神奇的预测能力。
所以当你再看到类似“读书无用论”、“工作都是别人的好”之类的说法时,请你留个心眼,想想我们这节课讲的知识,这些说法到底是不是一种幸存者偏差?
以及当你看到一些“成功学大师”向你兜售一些成功心法时,不要盲从所谓的权威,如果有可能,我们最好站得高一些,从多个经济周期的维度去评判某件事物或者某个人。
最后,不要总想着如何从成功者那里学习如何成功,也要从失败的人那里总结为什么会失败,因为成功很大程度上来说,就是一个去避免失败的过程。毕竟别人的成功你不一定能复制,但别人踩的坑,你若不注意,很大几率你也会摔一跤。
在我们工作和生活当中,一定要注意不能犯同样的“错误”——采用非随机的结果来证明我们的观点,更不能用幸存者偏差——拿结果倒推原因来解释我们的一些结论。
注意自己“不犯错”是一方面,另一方面我们也要学会“发现错误”,学习前人失败的经验教训。当你在工作生活里别人和你兜售一些貌似合理论调时,希望你对“沉默的数据”留一个心眼,在看向那些闪闪发光的成功数据时,也要意识到有很多“话少”甚至“不说话”的数据存在。
也正因为有这么多“沉默”的数据,我们很难在现实世界得到完整的数据结果。因此我的愿景不是照本宣科地教会你各种各样的数据知识和理论,而是希望能让你对这些数据的分析方法和缘起有更好的理解,最终帮助你在生活中做出更有效的决策。
思:很多预言成功的原因是因为存在幸存者偏差,就比如有人在网上推荐股票,给10000个人推荐,总有几个是赚的,那么骗子就可能通过这个来试图证明自己能预测,其实这就是典型的幸存者偏差。要证明一个人的真实能力,就要利用随机对照试验来进行验证,采用真正随机的方式,并且有对照结果的验证手段。要做到去伪存真。
此文章为11月Day18学习笔记,内容来源于极客时间《数据分析思维课》,强烈推荐该课
网友评论