Lecture3 视频链接
Reporter: Jonas Peters
第三部分 从观察数据生成SCM
两个变量之间的因果关系
对于一组数据, 如果只包括2个变量 X, Y。由于 Markov 等价类的原因, 无法相关性上推导出 X, Y 的因果关系, 因为存在如下两种可能
-
由于不存在 d-sep 所以, 无法区分以上两种关系。
Restricted SCM --- 线性关系与高斯分布
在下图中, 假设上: 可以写成
和
的线性组合。 如果,
和
的联合概率分布不是高斯分布, 那么就无法得到由
和
组成的,关于X 的线性关系。
基于此, 我们就可以得到了因与果的可辨别性。
![](https://img.haomeiwen.com/i25067830/d80a6220efea02af.png)
例子
假设, 和
现在如下线性关系:
![](https://img.haomeiwen.com/i25067830/df5abf7a72fe9ae3.png)
由上面的关系, 可以得出下面的散点图和回归线(红色)
横坐标是 x, 纵坐标是y
![](https://img.haomeiwen.com/i25067830/b528dcad0d62eb1b.png)
如果这时试图找出 , 得到的回归如下(红线), 明显这个回归是有问题的(方差不平均)。
![](https://img.haomeiwen.com/i25067830/2c3f6cb3c41316e3.png)
因此, 我们可以通过回归的结果,来判断 和
的因果关系
定理:
如果有
那么存在 使得
当且仅当: 是高斯分布
Restricted SCM --- 时间箭头
![](https://img.haomeiwen.com/i25067830/9e682493b7178019.png)
借由上面的定理, 可以推出一些应用
![](https://img.haomeiwen.com/i25067830/f6ac371dcf2ed4ff.png)
Restricted SCM --- 非线性关系
如果 和
的关系非线性, 那么因果就不可逆。
![](https://img.haomeiwen.com/i25067830/134bea7f254cea35.png)
例子
![](https://img.haomeiwen.com/i25067830/af3a9b3527ee6f31.png)
图形如下
![](https://img.haomeiwen.com/i25067830/193c805f4cb2b625.png)
如果做 的回归, 残差图如下
![](https://img.haomeiwen.com/i25067830/0416b6de1d721583.png)
真实案例 海拔与温度
![](https://img.haomeiwen.com/i25067830/0b08dedda560bc89.png)
真实案例 咖啡与诺贝尔奖
![](https://img.haomeiwen.com/i25067830/7110e64619d2cdb3.png)
正反两个方向 p-value 都很小 ===》 因果关系弱到不存在?
真实案例 模型判断因果关系的性能
讲着给出了一个实验,基于上面的各种图形, 判断,
的因果关系。 第二张图给出了各个模型的准确度(Accuracy, Y 轴)沿着 Decision Rate 的变化(测试的答案包括 X导致Y, Y导致X 和 不知道,Decision Rate 反应了 “不知道” 的占比 )。
图中灰色部分(Not significant)表示瞎猜的比率, 高于灰色部分代表了模型是有效的。
![](https://img.haomeiwen.com/i25067830/74a42c04b079bfc6.png)
![](https://img.haomeiwen.com/i25067830/1a0a8e9481ea03c4.png)
多变量之间的因果关系
如果搞明白了2个变量之间的因果关系,基本等于搞清楚多个变量之间的因果关系
![](https://img.haomeiwen.com/i25067830/e42ab9d87d68cabd.png)
比如, 对于如下图中包括的2个 SCM , 只要 Condition 在 上, 问题就退化成判断
和
的因果关系了
![](https://img.haomeiwen.com/i25067830/73da5da76477b165.png)
联合概率分布 的SCM可辨别性:
![](https://img.haomeiwen.com/i25067830/d5837e7962b9cf1f.png)
![](https://img.haomeiwen.com/i25067830/dc48b86affd3214a.png)
DAG 爆炸
![](https://img.haomeiwen.com/i25067830/e6924c4737bbdb0b.png)
一个解决办法是 Greedy Search
对可识别性归类
两个平面的交线,就是上面提到的 Gaussian 分布情况, 在哪条线上, 是分不出来在那个平面上的(同时在两个平面上)。
![](https://img.haomeiwen.com/i25067830/3541915741934c12.png)
一个关于可识别性的定理
这是给出一个 P() 和 Q(
)接近程度的量化, 从而量化了可识别度(identifiable)
: P和Q (上图) 的接近程度
![](https://img.haomeiwen.com/i25067830/86243f6966af8b30.png)
对正式 SCM 拟合的够好么?
这要取决于,你想拿得到的 SCM 去干什么 (What do we want to do with it.)
![](https://img.haomeiwen.com/i25067830/c6e83cb526982957.png)
一些模型的表现
这里没具体讲模型, 可能需要从其他地方找资料
![](https://img.haomeiwen.com/i25067830/62b32d1ff90e49c8.png)
![](https://img.haomeiwen.com/i25067830/434de52afbf67911.png)
invariant causal prediction
每次集中于一个变量
假设有如下一组关系
![](https://img.haomeiwen.com/i25067830/0c8771539fbb9e0b.png)
此时, 如果直接计算 , 则会得出如下结果:
![](https://img.haomeiwen.com/i25067830/a0c29ea3a6418c6e.png)
用了一个 R 包, 可以进行计算
![](https://img.haomeiwen.com/i25067830/76dd8495f3b10ea6.png)
这个包的原理, 在这张图里说明了
![](https://img.haomeiwen.com/i25067830/08974255fd34ac5b.png)
给出数学说明: 如果控制住了 的所有父节点(
),
不变。
![](https://img.haomeiwen.com/i25067830/41900f50b7e9bc52.png)
另一种表述
![](https://img.haomeiwen.com/i25067830/3d98d4313eed973c.png)
一个实践中的例子
![](https://img.haomeiwen.com/i25067830/fe617439a449386e.png)
本例中, 有多个组合通过了验证, 那么最后结果就是这些组合的交集, 是最后得出的 Y 的父节点。
![](https://img.haomeiwen.com/i25067830/508a673896d61b1f.png)
例子
在最后给出的 验证中, 只有 的 p-value < 0.05.
![](https://img.haomeiwen.com/i25067830/612c100940bd4bb8.png)
对于非线性, 就不管用了
![](https://img.haomeiwen.com/i25067830/b8e7a6ae446e5c60.png)
再有隐变量的时候, 也错了
![](https://img.haomeiwen.com/i25067830/aff98b704dba6171.png)
也不能对Y 进行干预
![](https://img.haomeiwen.com/i25067830/be5f7b38256c2112.png)
网友评论