美文网首页自然科普想法
数据和因果性(第三章):贝叶斯原则和因果图

数据和因果性(第三章):贝叶斯原则和因果图

作者: 东瓜科蛰 | 来源:发表于2019-11-14 23:15 被阅读0次

    从数据的相关性到因果性,需要找到数据之间的方向性。相关性没有方向性可言,A和B相关,与B和A相关,无论在概率计算还是图形表示上都没有任何差别。因果性却不然,A和B的原因,和B是A的原因,虽然在概率上无甚差别,但反映在图形上则是A与B的方向性差别。因此,因果性推理的工作就是从没有方向性的相关性推演出数据的因果性关系。虽然这个工作咋看起来非常简单,因为人们可以轻易确定冰激凌销量不是犯罪率上升的原因,也能轻易确定天下雨是地湿的原因,或者气压是气压计度数变化的原因,反之则不如此。但是,单纯从数据上看,冰激凌销量和犯罪率上升只是相关性,天下雨和地湿也只有相关性,但后者事实上是因果关系。在一些稍显陌生的环境中,或者我们希望找到事件之间的因果关系时,将相关性和因果性区分,并从相关性中找出因果性,就不是那么容易了。因此,找到一种恰当的方法从数据中找到因果关系,是珀尔的工作重点。但在这之前,还得找到一种方式用于处理相关性,以及处理原因和结果上的内在的关系。

    试问A和B是相关的,如何用数学加以表示?A是B的原因,B是A的结果,又如何用数学加以表示?A和B之间的相关性表明A的出现与B的出项有某种关系,比如A的出现次数越多,B的出现次数也越多,因此用概率来表示A和B之间的相关性是最佳方法。换句话说,A和B之间的相关性,并不表示A出现,B一定出现,而是A的出现表明B有更高的概率出现,反过来也可以说当B出现,A更有可能出现。请注意,这种表达没有表明A和B之间有因果关系。用概率表示如下表示:P(A|B)和P(B|A)是一样的,即当A或B出现的情况下,B出现的概率是多少。虽然相关性无法直接推出因果性,但是A和B之间的相关性显然比A和B之间独立有更多的信息,而且相关性至少是因果关系的一个必要条件。因此如果能找到另外的方法可以求出A和B之间关系的方向性,从相关性推出因果性便指日可待。

    很多时候,结论是看得见摸得着的,而原因却不见踪迹,能否根据结论推算原因的概率是贝叶斯方法的目标。P(A|B)P (B)=P(B|A)P(A),这是贝叶斯公式的基本表达式,具有基本概率知识就能推演,但是如何应用却是一门高深的学问。P(A)是A事件发生的先验概率,P(B)是B事件发生的先验概率,当我们知道B事件发生后,我们就必须根据这一事件修正我们对事件A 发生的信念程度,其中P(B|A)/P (B)称之为似然率,也就是知道事件A发生的概率,对事件B的信念程度的变化程度。简而言之,新证据总是能影响对已有现象的信念程度。当我们将某个领域的各个事件整合进一个网络时,我们便可以根据这一简单的公式,计算在知道一个新的信息情况下,如何调整对已有现象的信念程度。在贝叶斯图中,一个节点值的变化通过网络影响网络中与之相关所有的节点。从贝叶斯网络到因果图,在保留贝叶斯网络所有概率性质的情况下,通过恰当的方法,确定节点之间的方向。因为在贝叶斯网络中A→B→C,和A←B→C,在概率上没有任何区别,上文也有提到。而方向性对因果关系非常重要。A是因,B是果,所以,如果我想要B,我可以通过操作A获得,这一点无法通过贝叶斯网络完成。这也是珀尔说的人类有行动的能力。只有相关性,人类无法真正理解这个世界,因为知行是合一的。

    需要注意的是,因果图不是单纯靠数据就能建构起来的,需要研究者先验地建构某个因果图,然后根据已有地数据调整因果图上节点之间地关系,也就是检验和修正因果图。这就需要珀尔给出从数据到节点方向性的具体算法。概率、贝叶斯网络和因果图是因果推理的三个必要组成部分。

    相关文章

      网友评论

        本文标题:数据和因果性(第三章):贝叶斯原则和因果图

        本文链接:https://www.haomeiwen.com/subject/snarictx.html