昨天群里有位鸡娃妈妈贴出来了一道题,题目表述很简单,却没想到群里的家长们在答案上形成了两个阵营,各执一词,莫衷一是。
一派家长的答案是75%,计算很简单:不去喝酒的概率是10%,去喝酒的概率是90%,因为去每个酒吧的频率一样,所以去A、B、C三个酒吧的概率分别是30%。今天警察在A酒吧和B酒吧中都没有找到酒鬼,所以酒鬼要么没有去喝酒(10%),要么在C酒吧(30%),其中在C酒吧的概率为30% / (10% + 30%) = 75%。
如果用条件概率来计算,设酒鬼去C酒吧的概率为P(C),没有在A酒吧和B酒吧的概率为P(NA&NB),那么在没有在A、B酒吧的条件下酒鬼出现在C酒吧的概率为,
P(C|NA&NB) = P(C&NA&NB) / P(NA&NB)
其中,酒鬼在C酒吧且不在A酒吧也不在B酒吧的概率P(C&NA&NB)和酒鬼在C酒吧的概率P(C)一样,即0.3;酒鬼不在A酒吧也不在B酒吧的概率P(NA&NB) = 1 – 0.3 x 2 = 0.4,所以P(C|NA&NB) = 0.3 / 0.4 = 0.75。
另一派家长的答案是90%,思考过程很符合直觉:酒鬼每天只有两个选择,不去喝酒10%,去喝酒90%。在去喝酒的情况下,他要么去A酒吧,要么去B酒吧,要么去C酒吧;现在已经知道他不在A酒吧和B酒吧,所以他必然在C酒吧,因此这90%去喝酒的概率都应该算在C酒吧的可能上,所以酒鬼在C酒吧的概率为90% / (10% + 90%) = 90%。
这一派家长手中还有一个利器,那就是三门问题。他们认为这个酒鬼问题就是三门问题的一个例子——既然三门问题中主持人打开一扇门后剩下那扇门中奖的概率从1/3变成了2/3,那么酒鬼问题中警察搜查过两个酒吧后酒鬼在剩下那个酒吧中的概率也可以从30%变成90%。
三门问题,也叫做蒙提霍尔问题(Monty Hall problem),是一个上个世纪以来就富有争议的一个概率问题。
问题是这样的,观众在节目中会看到三扇门,其中一扇门的背后有大奖,另外两扇门的背后分别是一头山羊。观众随机选择一扇门以后,主持人会在剩下的两扇门中打开一扇有山羊的门,然后问观众是否愿意用他之前选定的那扇门和剩下的第三扇门进行交换,交换后观众获得大奖的概率是否会提高。
直觉告诉我们,大奖在每扇门背后的概率都是1/3,观众选到大奖那扇门的概率是1/3,大奖在剩下的第三扇门背后的概率也是1/3,交换选择并不会给观众带来更大的获奖机会。这一思路被很多人所认可,其中不乏许多数学专业毕业的学生。
不过,三门问题的正确答案是观众应该交换,交换后观众获奖的概率从1/3变成了2/3。
网上已经有很多关于三门问题的解答和分析,这里简单介绍其中的一种。假设观众最开始选择了A门,让我们来看看以下三种等概率的可能:
Y1)大奖存在于A门后。如果不交换,观众将得奖;如果交换,观众将不得奖。
Y2)大奖存在于B门后,主持人打开了C门。如果不交换,观众将不得奖;如果交换,观众将得奖。
Y3)大奖存在于C门后,主持人打开了B门。如果不交换,观众将不得奖;如果交换,观众将得奖。
由上可见,不交换的话,3种情况中观众只有情况Y1)才会得奖,概率为1/3;交换的话,观众在情况Y2)和Y3)时得奖,概率为2/3。
酒鬼问题第二派意见的家长认为,警察的角色和主持人一样,排除了某些可能的情况,使得余下情况的概率得到了提升,酒鬼问题本质上就是三门问题。
经过仔细思考,我的答案是酒鬼问题不等于三门问题,酒鬼问题的答案是75%。
酒鬼问题的具体解答前面第一派家长已经给出来了,下面说说酒鬼问题和三门问题的区别。
有人认为三门问题的关键在于主持人事先知道大奖所在的位置,所以他能确保打开的门的背后是山羊而不是大奖。这句话对!但不够准确。
我认为,酒鬼问题和三门问题最重要的区别在于计算概率的集合不同:酒鬼问题是个纯粹的条件概率问题,在计算概率时其集合是原问题集合中符合条件的一个子集,子集内的元素个数少于原集合中元素的个数;而在三门问题中,因为主持人事先知道大奖的位置,使得原问题集合中的每一个元素都可以一一映射到符合条件集合中的元素,集合中元素数量不变。
具体在酒鬼问题中,假设一共有10天,酒鬼有1天没去喝酒,3天去了A酒吧,3天去了B酒吧,3天去了C酒吧。10天中有6天在A酒吧或者B酒吧,不符合条件,所以在符合条件的子集中,只有1天没去喝酒,3天去了C酒吧,子集中元素个数只有4个,而不是原来的10个。
具体在三门问题中,假设一共玩了3次,观众选择A门,大奖1次在A门后,1次在B门后,1次在C门后,在3种情况中主持人都可以在余下的两扇门中选择一个背后不是大奖的门,使得这3种情况都符合条件,符合条件的集合元素个数仍为3,和原集合中元素个数相等。通过交换,观众在2种情况下都能获奖,从而提高了获奖概率。
让我们再看看如果主持人事先不知道大奖在哪扇门的情况。假设一共玩了6次,观众仍然选择A门。
N1)大奖在A门后,主持人打开了B门,观众不交换得奖,交换不得奖。
N2)大奖在A门后,主持人打开了C门,观众不交换得奖,交换不得奖。
N3)大奖在B门后,主持人打开了B门,主持人打开了大奖门,不符合条件。
N4)大奖在B门后,主持人打开了C门,观众不交换不得奖,交换得奖。
N5)大奖在C门后,主持人打开了B门,观众不交换不得奖,交换得奖。
N6)大奖在C门后,主持人打开了C门,主持人打开了大奖门,不符合条件。
由上可见,情况N3)和N6)不符合条件,所以原集合中元素个数是6个,但子集中元素的个数是4个,4个符合条件的情况概率分别为1/6,观众不交换得奖概率为1/2,交换后得奖的概率也为1/2。因此,如果主持人并不知道大奖所在位置,只是随机打开一扇门的话,三门问题就转化成了条件概率问题,得到了和酒鬼问题类似的结果。
可能有人会问,为什么这里既假设了大奖所在位置的3种情况,又假设了主持人打开B门或C门的2种情况,而在解答三门问题时只假设了大奖所在位置的3种情况?这是因为在三门问题中,主持人必须打开没有大奖的那扇门,并不存在着其它的可能,所以在三门问题的情况Y2)和Y3)中,概率分别为1/3,而在主持人事先不知道大奖位置的三门问题中,情况N4)和N5)的概率分别为1/6。
最后,再附送一个悖论。
桌子上有两个信封,其中一个信封里有100元,另一个信封里有200元,你可以拿走其中的一个信封。随机拿上一个信封后,问题是你该不该交换一下,拿走另一个信封使得自己收益最大化。
假设你开始拿上的是100元的信封,交换以后你将获得200元,交换带来的收益提升是+100%。假设你开始拿上的是200元的信封,交换以后你只获得100元,交换带来的收益提升是-50%。因为信封是随机拿起的,所以两种情况的概率各占50%,因此交换信封带来的收益提升的数学期望是(100% x 50% - 50% x 50%) / 100% = 25%。
玩上足够多次,不管你开始拿哪个信封,交换一下你就能平均多获益25%?
既然是悖论,当然是有问题的,问题在哪里呢?
文/Athlon_BE
2018.9.27
网友评论
还有一个问题,你的三门的算法不对,少说了一种情况,如果加上这种情况,结果就和我的结果一致了。
我的算法没那么正式,比较口语,先看三个门的问题,问题的前部分不变,ABC三个门,一个后面有奖,两个没奖,假设的一个人选了A,然后主持人打开C,告诉答题人C门没奖,然后问答题人换不换答案,但是这个问法我做一个小改变,你的问法是问答题人要不要换答案,我的问法是这样“好了,这位兄弟,现在我给你排除了一个没有奖的C门,那么现在再给你一次机会,AB两个门中你选一个吧,其中一个有奖,一个没奖,你选吧。”这样问的话大家就都能明白这个人选中有奖门的概率了吧。应该是50%。两个问法意思一样,答题人还选A就是回答你的问法的不换,选B就是回答你的问法的换,这样说没问题吧。
你的算法少了一种情况,所以换答案中奖概率变成了2/3,实际情况有四种,其中换答案中奖的情况就这两种,你都说了,而不换答案也中奖的情况也有两种,当选了A门不换答案时,如果大奖就在A门时,有两种情况,第一种打开B门,然后问答题者换不换,不换,中奖,第二种打开C门,然后问答题者换不换,不换,中奖,所以不换的实际情况有四种,中奖概率是1/2,同样换的实际情况也有四种,中奖概率也是1/2,换与不换,一共八种实际情况,四中奖四不中奖,所以最后的中奖概率就是50%,与我的问法的答案一致。
从三门问题上得出一个计算方法,当三个门时,每个门中奖概率都是1/3,平均分分配100%这个概率,那么这三个门的中奖概率比就是1:1:1,当去掉一个门之后,还剩两个门,而这两个门继续分配100%这个概率,而如何分配呢,已知这两个门的中奖概率比是1:1,所以平分,所以两个门的中奖概率都是50%。让我们回到酒鬼问题,同样的最开始酒鬼所在地的概率比是A:B:C:家=30%:30%:30%:10%=3:3:3:1,以这个比例分配这个100%的概率,然后警察去掉了A和B,然后就剩下了C和家里,这两个地方继续分配这个100%的概率,而怎么分配呢,在C的概率大于在家,所以还是按照之前的3:1的比例分配,于是在C酒吧的概率就是75%。或者可以这么理解,酒鬼只在这四个地方,所以总概率是100%,而排除两个地方,排除的这两个地方的概率占60%,总概率是不变的,那这排除的60%怎么加到剩余的两个地方呢,还是按照最开始的占比,以3:1的比例分配这60%,加到原概率上,答案还是C酒吧的概率75%。
三门问题争论了二十多年了,在网上还是不时地看到不同的见解。理解先验概率、后验概率或者条件概率,对贝叶斯公式和贝叶斯网络的学习都很有帮助。
0.9*1/3=0.3
其实他也可能正在去A和B的路上…或者穿梭在ABC家四点的路上
我只看到酒鬼酒,中大奖,还有一叠钱!
(三门角度似乎比较容易理解些嘞)