美文网首页
数据分析-后验概率

数据分析-后验概率

作者: 晴天忘雨 | 来源:发表于2019-05-15 19:56 被阅读0次

一个小问题:已知有两个盒子,一号盒里有18枚黑棋和2枚白棋,2号盒里有4枚黑棋盒16枚白棋,现将两盒置于箱中,随机从其中一个盒子抽出一枚棋子,为白棋,你认为这枚白棋从几号盒里抽出的概率更大?从2号盒抽出的概率为多少?

如果我们不知道抽出的结果,那么两个盒子概率各50%;当我们知道抽出为白棋的时候,我们就知道更大的可能是从2号盒抽出的,不用理论分析,直觉告诉我们就是如此。

但是数据分析不是一个仅仅依靠直觉的学科,依靠直觉说服不了别人,我们需要更专业的解读,那就是后验概率。

我们先用我们自己的方法试着做这道题:

            1号盒抽出白棋的概率 P(w1)=1/10;

            2号盒抽出白棋的概率 P(w2)=8/10;

            抽中1号盒并抽出白棋的概率P(w,1)=1/2*1/10=1/20;

            抽中2号盒并抽出白棋的概率P(w,2)=1/2*8/10=8/20;

那么白棋是从2号盒抽出的概率P(2|w)=\frac{2号盒抽出白棋概率}{随机从盒子中抽出白棋概率} =\frac{8/20}{1/20+8/20} =8/9;

可以理解吗?看起来很简单吧。

我们回过头看一下贝叶斯公式——后验概率的公式,我把详细的过程写出来。

贝叶斯公式:

            P(A|B)=\frac{P(A,B)}{P(B)} =\frac{P(B|A)*P(A)}{P(B)} =\frac{P(B|A)*P(A)}{P(A)*P(B|A)+P(!A)*P(B|!A)}

            (由于简书输入问题,这里用!A表示非A)

emmm。。。这个公式,简直就是鬼画符!

我们这里不解释每个表达式的含义,我们用另一种方式来解释这个公式。看下一个抽象一点的例子:

假设某个事件的结果为R的概率为P(R),造成B的原因有事件1、2、3,事件1、2、3发生的概率分别为P(1)、P(2)、P(3),事件1、2、3导致结果R发生的概率为P(R|1)、P(R|2)、P(R|3),现在事件结果R发生了,问事件1发生的概率是多少?

直观的理解:R发生的原因是事件1的发生概率为:事件1发生并导致R发生/事件R发生的概率

事件R发生的概率是什么呢?因为原因事件只有123,所以P(R)=事件1发生并导致R+事件2发生并导致R+事件3发生并导致R,即:

        P(R)=P(1,R)+P(2,R)+P(3,R)

很好理解吧?我们再分解一下,事件1发生并导致R发生:

        P(1,R)=P(1)*P(R|1);

就是事件1发生的概率*事件1导致R发生的概率,同理可得:

        P(2,R)=P(2)*P(R|2);

        P(3,R)=P(3)*P(R|3);

所以:

        P(1|R)=\frac{P(1,R)}{P(R)} =\frac{P(1,R)}{P(1,R)+P(2,R)+P(3,R)}

我们带入看一下:

        P(1|R)=\frac{P(1)*P(R|1)}{P(1)*P(R|1)+P(2)*P(R|2)+P(3)*P(R|3)}

有没有感觉很眼熟?没错,就是贝叶斯公式的123版本!

所以贝叶斯公式是什么?不记得了。

后验概率明白了吗?明白了!很简单!

相关文章

  • 数据分析-后验概率

    一个小问题:已知有两个盒子,一号盒里有18枚黑棋和2枚白棋,2号盒里有4枚黑棋盒16枚白棋,现将两盒置于箱中,随机...

  • 最大似然估计 最大后验估计

    MLE MAP 最大后验概率 wiki 机器学习基础篇——最大后验概率 MLE:首先看机器学习基础篇——最大后验概...

  • 贝叶斯公式和隐马尔可夫模型(2)

    在贝叶斯统计中,一个随机事件或者一个不确定事件的后验概率是在考虑和给出相关证据或数据后所得到的条件概率。同样,后验...

  • 机器学习-Logistic回归

    1. 后验概率与logistic函数 在贝叶斯分类中提到过后验概率,直接对后验概率建模的计算判别模型。 对于一个二...

  • 序列比对(十三)——后验解码

    原创: hxj7 本文介绍了如何利用后验概率进行解码,可称为后验解码。 前文《序列比对(12)计算后验概率》介绍...

  • 机器学习面试题集合

    朴素贝叶斯 朴素贝叶斯核心思想利用先验概率得到后验概率,并且最终由期望风险最小化得出后验概率最大化,从而输出让后验...

  • 朴素贝叶斯

    简介 P(X)由全概率公式计算 适用于知道先验概率,需要计算后验概率 优点:数据集不需要很大 缺点:如果特征不是独...

  • Mahout | 贝叶斯算法

    贝叶斯 基本思想 已知类条件概率密度参数表达式和先验概率 利用贝叶斯公式转换成后验概率 根据后验概率大小进行决策分...

  • 贝叶斯基本概念

    1.贝叶斯分类器 1.1贝叶斯定理 后验定理:后验概率 = (相似度 * 先验概率)/标淮化常量将B看作新的样本的...

  • 朴素贝叶斯

    后验概率(新信息出现后的A概率)=先验概率(A概率) x 可能性函数(新信息带来的调整) 1)先验概率(Prior...

网友评论

      本文标题:数据分析-后验概率

      本文链接:https://www.haomeiwen.com/subject/pcxmaqtx.html