电流和电压的公式是U=IR,这个公式中,是人类定义的。
光看这个公式觉得I和R决定了U,然而,R会随着温度变化,所以这个公式只是描述一个规律,并让人类好理解这个世界。
还有R=U/I,没有说是谁导致了谁,并不在乎因果,只是描述一个“规律”。
在大家的意识中,因果关系是相关性正好等于100%,如果A发生,那么B一定发生,就是相关系数等于1。
假如我和你都是小学生,你和我肯定都在长个子,那么你长高,我也长高,在这5年之内,你长高我也长高的相关性是1。大家都知道,因为我和你还在成长期。不是你长高,我也长高。
或许,你现在看到这里觉得很可笑,这不是谁都知道吗。但是生活中,各种事情在我们的生活中存在很多,只是我们没有意识到,还有这些事情没有威胁我们的生存。
后来又有哲学家想了个办法。说所谓 “X 导致 Y”,这个因果关系可以用 P(Y|X) > P(Y) 来定义:X 的出现,增大了 Y 出现的可能性。这是一种概率化的因果,但是也不能排除单纯的相关性。
珀尔倒是给了一个更好的定义:P(Y | do(X)) > P(Y). 也就是说,如果你单方面对 X 做一个干预动作,导致 Y 的概率增加,那么就是 X 导致了 Y。这个可能是目前为止最合理的定义。
但是我觉的都不合理,因为这个世界非常复杂,影响的因素很多,然而我们这样生存,我们只能尽可能推倒旧的知识,创建新的知识,再等着更新的知识来再推倒新的知识,这个过程不断继续下去,这就是科学的精神。
比如说,一个国家的人均巧克力消费量,和这个国家的诺贝尔奖得主人数,有一个非常强的正相关。
皮尔逊说这就是一个没什么意义的伪相关。你总不可能说吃巧克力有利于得诺贝尔奖。让我们解释这个相关性的话,肯定是巧克力消费量高是因为这个国家的经济比较发达,而经济比较发达的国家容易出诺贝尔奖得主。
然而,你这么思考问题了,就用了因果关系了。
这推论就好玩,就纠结了。明摆知道有些就是伪相关。然而,真的巧克力消费高就说这个国家经济发达,巧克力原产国不一定是一个落后的国家了。还有一定经济发达的国家就更容易获得诺贝尔奖了,肯定还有其他因素影响着。
人类更喜欢用因果关系,因为用因果关系的思维去思考问题,我们觉的很有用。
这时候,我想到人工智能和大数据,这些东西也是人类的主观选择,人类定义数据的大小,范围等等,还有用什么样算法,其实都是人的主观选择。
数据是客观的,而人的观点是主观的。相关性是客观的,因果是主观的。你想想人工智能和大数据,你就会另外的想法。
因果分析这个思想的最高妙之处就在于,你无须确定真正的因果关系,你无须回答“为什么”。
真实世界里任何事情都是错综复杂的,你根本就无法列举影响一个结果的所有可能缘故。你必须做出各种取舍,你只能把你认为最重要的缘故画在图上。图画完了,你并没有科学地、彻底地、逻辑完备地回答“为什么”,你只是说,根据你的猜测,应该是因为这几个缘故。
而事实上也不需要回答“为什么”。我们在生活中的实际应用,对改变世界真正有用的,其实就是回答“观察、干预、想象”这三种问题!
所以因果分析的最终目的不是查明因果关系,而是回答三种问题。这三个问题比因果关系更基本 —— 因果关系只是我们回答问题的手段。
没有这个手段,只靠数据分析,你回答不了第二和第三种问题。当然,有了这个手段,如果你的因果模型不准确,你给的答案也会不准确 —— 你可能会漏掉一个特别重要的因果关系,你可能忽略了黑天鹅事件。但是这不要紧!预测未来的事儿本来就是谁也保证不了100%准确。
哲学家的世界观谁也反驳不了,但我们这里不解决世界观问题,我们解决方法论问题就可以了。
最后,请注意,虽然模型是主观的,但是因果分析仍然具有客观的性质。如果两个人的假设相同,他们画的因果关系图就是一样的,那么因为接下来的数学方法是客观的,这两个人对未来的预测,必定是100%相同。
我建议你花点时间琢磨一下这个道理,这里边有哲学。主观和客观,非常有意思。按理说这个世界应该是完全客观的存在,科学家一直在试图客观地认识世界。可是我们不管是给东西分类也好,提出因果关系也好,做预测也好 ——
只要你心念一动,你就必然是主观的。
网友评论