美术馆有一副名画被盗,如果你是一名侦探,现在有3名嫌疑犯,分别是惯犯、混混以及管理员。并且在现场发现了一副嫌疑人漏下的手套。
已知预估事情的惯犯的偷画几率为70%,混混的偷画概率为20%,而管理员的偷画概率为10%。
并且,在作案时候后,惯犯漏掉手套的概率为10%、混混是40%,管理员为60%。
那请问谁最有可能是偷窃名画的嫌疑人?乍一看这个问题考验的是我们的推理能力,其实背后隐藏的却是概率问题。
三个嫌疑人已知的每人偷画的概率为先验概率,然后更具“在现场发现手套”这个条件来调整我们的鲜艳概率,最终算出三个嫌疑人最终可能作案的概率叫做后验概率。
后验概率=先验概率*调整因子
这就是概率论中注明的贝叶斯概率。
作为成年人,很多时候我们都很容易想当然,而并不像统计学那么精确,被根据自己的经验认定惯犯最可能偷盗,而不会根据新的证据调整自己的假设。虽然惯犯很容易偷窃(70%),但并不太可能犯遗漏掉手套(10%)这样的低级错误。
还有的人非常注重后验概率,他们发现管理员遗漏手套的可能性最大(60%)但却忘记了管理员的去做盗劫的先验概率(10%)很低。
那么如何才能避免这种低级错误呢?我们不妨简单的了解一下贝叶斯统计学。
前文提到的“先验概率”中的“先验”,即意味着我们是在获取某个信息之前,事前给出的一个概率。而“信息”指的的附加状况。通常我们得到的“先验概率”是通过经验来判断的,带有极强的主观性。
推算的第一步就是为这三位嫌疑人的偷画概率进行比例的数值分配。即意味着,假设面前的嫌疑人一定属于其中一种,在此为前提的,该江洋大盗为第一种,第二种或第三种的可能性有多少。
![](https://img.haomeiwen.com/i7816866/4877af554c879aea.png)
上图可以理解为将整体分为三个不同的情况。意味着,嫌疑犯为三种类型人中的一个。在A情况下,作案人是惯犯,在B情况下,作案人是混混,在C情况下作案人是管理员。但我们却并不知道到底是哪种情况。
用数字来计算概率的情况下,需要在多种可能性中,选取“将各部分概率相加,总和为1”的情况,这种情况被称为“标准化条件”。这样处理,相对而言更加直观和简单。
然后,第二部就是要设定他们各自会“遗漏手套”的概率。这个概率是需要基于一定经验、实证、实验的数值。这个称为“条件概率”。我们的先验概率如果是称为拍脑门儿的话,条件概率就必须相对精准。这样才有可能得到准确的数字。所以,如果条件概率没有相关经验和数据作为支撑的话,这个工作就不能继续下去。
所幸,已知条件给了条件概率,即:惯犯漏掉手套的概率为10%、混混是40%,管理员为60%。我们可以将这个条件概率天填入到之前的表格中,得到如下表格:
![](https://img.haomeiwen.com/i7816866/e60d6e0d1349f61f.png)
我们可以看到,横向的每一行的总和为1,而纵向的每一列的总和并不为一。也就意味着,横向上看,每一类人都可能产生3中不同的行为,,而纵向的对象却包含了三种不同类型的人,并没有涵盖所有的行为。
那么这种某一特定类别采取各种行动的概率称为条件概率,即在原因明确的情况下,某一类别采取各项行动中的结果的概率。那么,对于某个人而言,他们的可能性到底有多大呢?
我们仍然可以用矩形来表示,如下图。
![](https://img.haomeiwen.com/i7816866/4dafb36c2237d4f3.png)
我们可以通过算矩形的面积来判断这6中可能性,即所有可能性所发生的概率,而概率之和等于1.即:
![](https://img.haomeiwen.com/i7816866/679940f173e71119.png)
然后,我们还知道,犯罪分子在现场遗漏了手套,也就意味着没有手套遗漏的可能性全部都消失了。当我们观察到了某一种行为,则意味着为这个“可能的世界”增加了新的信息,就会排除掉“没有手套遗漏”的所有“可能世界”。
即:
![](https://img.haomeiwen.com/i7816866/38d833a24b4e8421.png)
这意味着,由于条件的出现,可能性从6变成了3个,但此时的概率相加总和不再等于1,那么我们需要调整概率,在保持比例不变的情况下,使得概率相加的总和为1,恢复到标准化条件。
(左边长方形面积):(中间长方形面积):(右边长方形面积)=0.07:0.08:0.06=7:8:6
简化后,合计7+8+6=21
所以:
(左边长方形面积):(中间长方形面积):(右边长方形面积)=7/21:8/21:6/21
可以看到,通过遗漏手套得到概率是发生了调整的,惯犯可能的概率变为33%;混混的概率为38%;而管理员的概率为28%左右。这和我们的直觉判断是差别很大的。
生活中的偏见、歧视,包括罕见病的假阳性这样的例子经常出现,如果我们拍脑门儿,总是容易得出错误的结论,而使用简单的贝叶斯统计,可以让头脑更加清晰,少犯很多低级错误。
网友评论