美文网首页
必须学会的数学工具(三)——贝叶斯定理

必须学会的数学工具(三)——贝叶斯定理

作者: 叽哥的黑板报 | 来源:发表于2017-08-07 19:58 被阅读0次

    如果说,世界上有什么定理是人生来就会的,我会毫不犹豫的说,贝叶斯定理。

    贝叶斯定理是一种特殊的计算概率的方法,为什么说它特殊?

    贝叶斯定理计算概率与频率学派计算概率有本质的不同。

    贝叶斯学派计算的是主观概率,频率学派计算的是客观概率。

    两者对概率的定义不同。

    频率学派倾向定义为:“will it happen or not”。(发生或不发生)贝叶斯学派倾向定义为:“believe it or not”。(相信或不相信)

    举个例子,求抛硬币、掷骰子每种可能性的概率。频率学派认为,当数据为无穷大时,得出的概率一定会无限接近均匀分布。抛硬币正反是50%,掷骰子是1/6,(即事件A在独立重复试验中发生的频率趋于极限P,那么这个极限就是该事件的概率。)这属于频率学派的思想。而贝叶斯学派的不同点在于,贝叶斯学派并不在意“事件”本身的建模,而是将自己置于观察者的位置,不断的通过观察获取“证据”。并把这些“证据”放在贝叶斯概率论的框架下,以推断事情的结果,“证据”越多,结果越准。

    如果有两个人,使用贝叶斯定理计算相同一件事,得出的答案大概率上是有差异的,两人中,若有一人叫“知情者”,他对本事件有非常深的洞察。另一人叫“不知情者”,他对本事件一知半解。同一件事,对知情者来说是“确定性事件”,而对不知情者而言就是“随机事件”。

    随机性并不源于事件本身是否发生,只是描述观察者对此事件的知识状态。

    比如抛硬币100次,期许是正反各50次,结果正面85次,反面15次。

    以贝叶斯概率论,出现了新的观测结果,就需要依照观测结果更新,打破之前的期许,上调得出正面的概率。

    问:在生活中,贝叶斯定理哪里看得到?真的用得着吗?怎么用呢?

    不论是新生儿对世界的探索与了解,还是企业家对商业的洞察与试错。都有贝叶斯定理的痕迹,它无处不在,只需有心人发现。

    在回答用不用得着之前,先看下面这个问题。

    请问广大宅男/宅女。

    你发给女神/男神的微信,如果只有70%收到了回复,TA对你有意思的概率是多少?

    没错,这个问题就可以用贝叶斯定理算出来。你说有没有用?想不想学呢?

    贝叶斯定理公式

    P(AIB)=P(BIA)*P(A)/P(B)

    首先要弄清楚几个概念

    先验概率:在考虑观测数据前,能表达不确定量P的概率分布。

    后验概率:在考虑和给出相关证据或数据后所得到的条件概率。

    条件概率:事件A在另外一个事件B已经发生条件下的发生概率,表示为p=(AIB)

    可能性函数/似然函数:一种关于统计模型中参数的函数,用于在已知某些观测所得到的结果时,对有关事物的性质的参数进行估计。

    这四个抽象的表达一定让人晕,我们先实战一道题,从例题中学习比抽象的理解要高效的多。

    贝叶斯定理有个非常经典的用法,将其用于疾病的筛查。

    假设有一种病,得病的几率为万分之四,有一种疾病筛查技术,能检测是否染病,准确率达到99.9%,筛查结果是阳性,得病了。那么检查出阳性的情况下,真正患病的概率是多少?

    仔细看题目中最重要的三个变量。

    我们先设检查为阳性的概率是P(Y)。

    2、得病的概率设为P(B)(先验条件,之所以称为“先验”,是因为不必考虑任何B方面的因素。)

    3、设检查出阳性的情况下得病的概率为P(BIY)。(因为这是求得病的概率,所以代表得病的B在前,阳性是前提,放在后面。P(BIY)为后验概率。)

    套入贝叶斯公式,得出算式:

    P(BIY)=P(YIB)*P(B)/P(Y)

    P(Y)=P(YIB)*P(B)+(1-P(YIB))*(1-P(B)),(筛查的概率不是100%,所以患者在没有得病的情况下,也可能是阳性。用1减去P,便能得出。)

    万分之四=0.0004

    99.9%=0.999

    P(BIY)=0.999*0.0004/((0.0004*0.999)+(0.9996*0.001))

    =0.285591

    在检查结果为阳性时,患病概率是28.5%。

    现在终于进入正题,如何用贝叶斯定理算男/女神对你有没有意思。

    ·设P(X)=P(喜欢一个人)=男/女神喜欢一个人的概率

    ·设P(H)=P(回微信)=男/女神正常情况回复微信的概率

    ·设P(XIH)=P(喜欢一个人I回微信)=回复微信的情况下喜欢一个人的概率

    ·设P(HIX)=P(回微信I喜欢一个人)=喜欢一个人时回复微信的概率

    这些全部都是未知的,需要靠自己收集情报、调研或臆想得出。当然,这样准确度会很低。

    我怎么可能这么不负责。教你几招提升准确率的方式。

    邓巴数字。

    “邓巴数字”也称“150人数字”,人类智力所允许的社交网络,上限约为150人。就算他微信里有上千的好友,最多和150人维持亲密关系。如果TA目前没有喜欢的人.......

    同性朋友占65%以上。

    你可以直接从150人里面去掉65%的竞争对手,使数据更精确。如果他是个同志的话.......

    这是个看脸的社会。

    你长得帅可以给自己加权重。要是长得丑..........

    P(HIX)可以以自己的标准来设定。P(HIX)设为100%,P(H)为70%。

    P(XIH),先用邓巴数字*(1-65%),假设你很漂亮,适当的给自己加点权重。比其他人高60%吧。其实还可以给特别不体面的人减一点权重。

    我们将其带入贝叶斯公式:

    P=(XIH)=P(HIX)*P(X)/P(H)

    P=(XIH)=1*((150*0.35)*1.6)/0.7

    =0.0435

    概率为4.35%

    在人类的基因中,给予了我们直觉,以指导我们的生存,而涉及到科学的领域,原始的直觉便不起作用了。用数学工具和理工科思维,是这个科技腾飞的时代的生存法则。

    贝叶斯定理,你学会了吗?

    相关文章

      网友评论

          本文标题:必须学会的数学工具(三)——贝叶斯定理

          本文链接:https://www.haomeiwen.com/subject/epoalxtx.html