Lecture2 视频链接
Reporter: Jonas Peters
因果关系的存在性定义

工具变量 Instrumental Variable

这部分内容和 Potential Outcome 里讲的差不多,可以直接看书。
IV 是为了解决无法测量的 Confounder , 而进入一个外部变量 I。
- 必须只与 X 有直接关系, 而和 H 和 Y 没有直接关系
- 通过替换,寻找 Y 和 I 的关系, 从而避开了 H
- 对于 Y 对 I的回归, H 对 X 的影响会带来噪音, 但是不会影响结果
反事实 Counterfactuals

讲者给出了一个定义:
令 通过得到的观察结果, 就可以得到一个 反事实 SCM
其中:
-
: 代表SCM模型,
-
代表因果图(整个因果关系网 )
-
代表噪音分布
-
-
-
代表在干预状态下(
)的噪音分布
-
Counterfactuals 就等于在一个新的 SCM中 ()做一个新的陈述(statement)。
解释
反事实,要求的就是, 在保证其他因素都不变的情况下, 我只改变我关心的部分(), 我希望知道在
取特定值的情况下, 原有的系统会出现什么状态。 不变的部分,可以视为 “环境”。 反事实往往是一种理想状态的猜想。
比如, 一个病人用A治疗, 8周以后好了。 现在想知道, 如果用 B 治疗, 会有什么效果呢? 由于不可能重新治疗一遍, 这时就只能用反事实来推演。
举例
假设一个医生,对A病,有一种治疗手段T, SCM 为
: T服从的分布, 取值为1--- 治疗, 0--- 不治疗
: 恢复拒绝与是否接受治疗(T=0还是1?)和
(噪音)
: p=0.99 的伯努利分布
假设, Tom 来到诊所, 接受了治疗(T=1) 但是没治好 (R =0), 依据这个观察值 (observation), 可以推测出
得到Tom 的SCM
这时, 反事实就是:
翻译 :Tom would have recovered had he received no treatment. (如果Tom 没有接受治疗, 他现在就好了)
第一部分总结

如何发现因果关系?
不同与 Statistical Learning 因果学习很难直接从数据中获得

大家都知道 相关不等于因果, 但是

假设 X , Y 不独立, 那么有如下可能
- X 是Y的因
- Y 是X的因
- 有一个共同原因导致了X,Y
- 以上三者组合
这个Principle 给出了一个寻找因果的方向。
d-Separation

这里涉及到 d-Seperate 中的链式结构,碰撞结构,分叉结构。 这部分是前置知识
举例
和
被
d-Seperate
马尔科夫 Markov
什么是 马尔科夫?

马尔科夫等价于:

用处
在已知 X,Y 独立性(包括条件独立)的前提下, 可以推导出 SCM。 不过,符合一组独立条件的SCM 不一定唯一。
例子
-
i ) 已知 对于
(简书不支持独立的符号 \Perp 只能用这个替代) 那么可以推导出 SCM:
-
ii ) 已知 对于
那么可以推导出 SCM:
基于独立性的(寻找因果关系的) 方法

其实现在已经有些包, 可以自动化的完成第一步了。

网友评论