今天的故事要从美国一档很火的TV show说起。
你是一名参赛者,面对3扇门,门后面分别是1俩车,2只羊,只要猜对了哪扇门后面是车,汽车就归你啦。请看图,你选择了门1,揭晓答案前,主持人打开了门3,并展示了里面的羊,请问你继续坚持选择门1还是换门2呢?请在心里确定你的选择[1]。
概率论上都学过,在主持人打开第3扇门之后,汽车在1还是2门后的概率要重新计算,并且均为1/2,换不换选择获得汽车的概率是均等的。
但不管是资深数学家的推算,还是程序员的模拟运算,甚至是TV show现场的统计结果,都证明,更换后赢的概率是不换时的2倍!
这就是传说中的三门问题,也被称为蒙提霍尔悖论。无数自认为概率论学的很好的人都深受困扰。
一言不合先穷举,简单粗暴有效。
假设选择门1,汽车和山羊在门后的排列一共只有3种可能:
(1)车、羊、羊:概率为1/3
因为首次选择门1是正确的,不管主持人打开的是门2还是门3,更换选择输,不换选择赢。
(2)羊、车、羊:概率为1/3
主持人必打开门3,更换选择选择门2则赢,不换选择输。
(3)羊、羊、车:概率为1/3
同(2),主持人打开门2,更换选择选门3则赢,不换选择输。
是时候累加一波了,对于更换选择来说,(1)输,(2)、(3)赢,更换赢的概率是2/3,不换选择只有1/3。
什么?穷举看起来很Low?其实有个更简单的思维方式。
既然主持人的设定是百分百打开剩下的错误的门,必然会排除掉一个错误的答案。
选择门1时,车在门1后的概率是1/3,在门2或门3后的概率是2/3,主持人的作用就是帮你把错误的门排除掉,剩下那扇门则继承了2/3的概率。
故事讲完了,咋一听违反常识,仔细琢磨却后合乎其理。有同学就问,三门问题可以应用到日常中吗?来看看他怎么说。
做选择题时,有A、B、C三个选项,先选择A,用排除法可以排除掉C,此时再选择B,按照三门问题的设定,正确率一下子是不是提高了2倍呢?[2]
想法是好的,可惜的是,并不成立。因为排除过程是随机的,有可能会把第一次猜测的答案排除掉,而三门问题的主持人的设定之一就是不会打开你第一次选择的门。
所以,三门问题除了人为设定场景,并没有现实意义吗?这个结论下的有点早,其实三门问题隐含的是用贝叶斯公式计算条件概率的思想。
贝叶斯定理解决的是已知A事件发生时发生B事件的概率P(B|A)和A事件、B事件的发生概率,求解B事件发生时A事件发生的概率P(A|B):
设:
A1、A2、A3分别表示汽车在门1、门2、门3后面的事件
a1、a2、a3分别表示主持人打开门1、门2、门3的事件
已知你选择门1,主持人打开了门3
解:
(1)汽车的放置是随机的,所以
P(A1)=P(A2)=P(A3)=1/3
(2)主持人选择了门3说明汽车在门1或者门2后面
汽车在门1时,主持人打开门2、门2均可,打开门3的概率P(a3|A1)是1/2
汽车在门2时,主持人只能打开门3,打开门3的概率P(a3|A2)是1
P(a3)=P(A1)×P(a3|A1)+P(A2)×P(a3|A2)=1/2
(3)于是我们可以求出:
汽车在门1后的概率为:
P(A1|c3)= P(A1) × P(a3|A1) / P(a3)=1/3×1/2÷1/2=1/3
汽车在门2后的概率为:
P(A2|c3)= P(A2) × P(a3|A2) / P(a3)=1/3×1÷1/2=2/3
汽车在门2后的概率是在门1后的2倍,应该更换选择[3]。
看起来高大上,可是这个日常生活中又有什么用呢?
别着急,我们再来看一个例子,一道学过概率论都做过的一道经典例题:
假设某地区每1000人中就有一人患有艾滋病。检验是否患有艾滋病的方法是用某种血液试验检测法检测身体中是否含有艾滋病病毒,这种方法相当精确,但也可能带来两种误诊。首先,可能会让某些真有艾滋病的人得到阴性结果,称为假阴性,不过只有5%的概率发生;其次,还可能让某些没有艾滋病的人得到阳性结果,称为假阳性,不过只有1%的概率会发生。
那么,在艾滋病检测呈阳性的条件下,被检测者真正患有艾滋病的概率是多大呢?[4]
抛开答案不论,凭感觉先来猜测一下,是大于90%,还是50%左右,亦或是不到10%呢?请挑选一个你喜欢的答案。
也许凭感觉会认为假阳性只有1%的概率,看来被检测者阳性时患病概率应该高达99%。先别急,看看贝叶斯公式会得出什么样的结果。
设:
事件A为“被检测人带有艾滋病病毒”
时间B为“表示被检测人不携带艾滋病病毒”
事件T为“试验结果呈阳性”
被检测者真正患有艾滋病的概率则为P(A|T)
解:
直接上概率学公式
P(A|T)=P(A)×P(T|A)/P(T) //贝叶斯公式
P(T)=P(A)×P(T|A)+P(B)×P(T|B)//全概率公式
根据题意P(A)=0.001,P(T|A)=1-0.05=0.95,P(B)=0.999,P(T|B)=0.01
代入数据可得,P(A|T)=0.087=8.7%
也就是说,在艾滋病检测呈阳性的条件下,被检测者真正患病的概率仅有8.7%!!!
故事就先说到这,第一感觉的常识和缜密计算的结果真的大相径庭。
你以为你以为的就是你以为的?
还是一言不合就算几道数学题吧!
首发于微信公众号:诊断分析
引用:
[1] http://www.cnblogs.com/twocats/p/3440398.html
[2] http://www.guokr.com/post/664895/
[3] http://blog.sina.com.cn/s/blog_6e3bc6710101g6za.html
[4] https://www.zhihu.com/question/20195024/answer/14292100
网友评论