随机并不随机
设想一个转盘游戏有红黑两种,且颜色各占一半。现在请你写下自己的预测结果。如果你配合可以此刻直接写到评论区,再来看文章后续内容。
首先要说的一点是,转盘是否公平,你心里其实已经预先有了答案。
曾有大量人参与过这一实验,5次转动转轮产生的红、黑(R/B)颜色序列,一共有32种可能。由于每次转动转轮之后小球停在红色或黑色区域的概率相同,因此上述32种序列出现的概率也相同。
事实上,人们的选择并不均匀。不信你可以看看自己写下的答案。其实,BBRBR、BRRBR 这类序列出现的次数远远超过预期,RBRBR这类序列出现的次数则低于预期,而 RRRRR 几乎没有出现过。对于这样的结果,看起来似乎理所当然。与 BBRBR 相比,RRRRR 给人的感觉并不像一个随机序列,尽管转动转盘出现这两种结果的概率是相同的。
如果再让你立刻说一个1——20之间的数字,你选择的是17,或者是7么。大量测试显示如果让人们在1——20之间选一个数字,17是最常被选到的数字。如果我们让人们在0至9之间选一个数字,他们最常选的是7。在随机选择时,末尾是0和5的数字出现的次数远低于我们的预期,在人们心目中,这些数字的随机程度似乎比较低。
先验概率
关于转盘的问题,我们通常默认它是一种非常公平的游戏,小球停在红色或黑色区域的概率是相同的。但是,就是有人认为转轮偏向于某个颜色。这其中包括:
- 红色论:转轮偏向于红色,小球停在红色区域的次数占比为60%。
- 公平论:转轮是公平的,小球停在红色区域与黑色区域的次数相同。
- 黑色论:转轮偏向于黑色,小球停在黑色区域的次数占比为60%。
如果我再问你这三种理论的置信度是多少?除非证据确凿,通常我们很可能会认为轮盘赌是公平的。例如公平概率为90%,黑色论与红色论正确的概率分别只有5%。
注意,此时的90,5,5就是所谓的先验概率(priori probability),即认为某个理论正确的概率。
当然,不同的人可能有不同的先验概率:怀疑论者认为三个理论的先验概率都是1/3,而有些人充分信任庄家的节操,认为红色论与黑色论的先验概率只有1%。
但是,这些先验概率不是一成不变的。如果我们找到了某理论优于另一理论的证据(例如,小球连续5次停在红色区域中),不同理论的置信度就会发生改变。
后验概率
那么,这个规律在转盘中会起到什么作用。我们转动转轮5次,得到RRRRR的概率是多少呢?这个时候,之前的先验概率就要发挥作用了。
在公平时,每次转动转轮后小球停在红色区域的概率为1/2,因此,得到RRRRR这个结果的概率为:1/2×1/2×1/2×1/2×1/2=1/32=3.125%换言之,得到RRRRR与得到其他31种颜色序列的概率完全相同。
如果黑色论是正确的,小球停在红色区域的概率为40%,即0.4,那么,得到RRRRR结果的概率为:0.4×0.4×0.4×0.4×0.4=1.024%
如果红色论是正确的,小球停在红色区域的概率为60%,那么,得到RRRRR结果的概率为:0.6×0.6×0.6×0.6×0.6= 7.76%
公平论的先验概率为0.9,这个先验概率的3.125%,即0.9×0.031 25(0.0281),即“公平论正确且小球5次停留的区域为RRRRR”的方框中,剩下的0.8719则是“公平论正确但停留区域不是RRRRR”。
同理,红色论的先验概率是0.05,因此,“红色论正确且结果为RRRRR”的先验概率是0.05×7.76%=0.0039;而“红色论正确但结果不是RRRRR”的是0.0461。黑色论的先验概率也是0.05。但是,黑色论与RRRRR这个结果之间的关系很扭曲,因此,“黑色论正确且结果为RRRRR”的概率为0.05×1.024%=0.0005。
我们可以画出下图。
如果我们转动转盘并且真的得到RRRRR的结果,对红色论而言就是好消息,对黑色论而言则是坏消息。
小球连续5次停在红色区域,这种情况位于方框图的下排,黑色论、公平论与红色论的先验概率分别为0.0005、0.028和0.0039。换句话说,在这种情况下,公平论与红色论的先验概率比率大约是7∶1,红色论与黑色论的先验概率比率大约是8∶1。稍加换算,黑色论正确的概率是1.5%; 公平论正确的概率是86.5%; 红色论正确的概率是12%。也就是说,和最初相比,由此可见,红色论的置信度增加一倍多,而黑色论的置信度几乎消失。置信度的这种变化是十分恰当的,小球连续5次停在红色区域,我们对转轮受到人为操纵的怀疑当然会增加。
到这里,上述计算展示了在连续5次看到小球停在红色区域之后,公平论、红色论、黑色论的置信度的变化情况,也就是所谓的后验概率(posterior probability)。
贝叶斯推断
先验概率描述的是看到相关证据之前的置信度,而后验概率描述的是看到相关证据之后的置信度。我们所做的工作叫作“贝叶斯推理”(Bayesian inference),由先验概率到后验概率的需要用到“贝叶斯定理”(Bayes’s Theorem)的概率公式。
在贝叶斯推理的过程中,人们在看到证据后,某种理论的置信度不仅取决于证据的内容,还取决于一开始时的置信度。
单纯地依靠零假设显著性检验的做法,其实违背了贝叶斯推理的本质。例如吃一个西瓜病情延缓和吃药病情延缓得到的统计概率都可能是0.05。也就会让人认为西瓜与药有相同的疗效。
费舍尔曾说过:“科研人员不会设一个固定的显著性临界值,然后年复一年,无论情况如何变化,都依据这条红线去推翻各种假设。相反,他们会在证据的启示下,结合自己的想法,认真考虑每一个具体案例。”
贝叶斯定理对推理方法产生了广泛的影响,例如教会机器根据人们输入的大量数据来学习,但这些方法并不适用于回答是或否的问题。对于是或否的问题,人们常常借助费舍尔的方法做出判断。具体的说,信奉贝叶斯定理的统计学家通常对显著性检验不感冒,他们对“该新药是否有疗效”之类的问题不感兴趣,而是更关注如何建立一个预测模型,以便更准确地判断该药物的不同剂量在针对不同人群时可以取得什么样的疗效。
回到最开始的问题。出现RBRRB与RRRRR这两个结果的可能性都非常小,而且概率相同,但是在人们看来,前者是随机结果,后者则不是,这是为什么?贝叶斯的统计学观点足以解释其原因。当看到RRRRR这个结果时,我们就会更加相信一个转轮盘做过手脚,小球会停在红色区域,对于这个理论,我们已经赋予了某个先验概率。但是,如果出现的结果是RBRRB,我们确不会认为转轮中藏有可以产生RBRRB这个结果的特殊装置。先验概率不是一视同仁,而是有所取舍的。在心理上,有的想法会得到明显的重视,而对于RBRRB这一类结果,我们赋予它们的先验概率几乎接近于零。
相较于复杂想法以及以完全陌生的现象为基础的想法,我们往往更喜欢简单的想法和那些通过类比我们所熟知的事物而产生的想法。这种喜好似乎是一种不公平的偏见,但是,如果没有任何偏见,我们就有可能整天都处于震惊的状态。比如,就在刚刚,我竟然听到外面有汽车嗯了三下喇叭。
加入靠谱熊基地,和大家一起交流 添加我的微信
网友评论