为什么因果图上去掉了那条边,就意味着让未服药的女性也服了药。或者说怎么通过去了一条边达到了RCT(随机对照实验的效果)?
2021-09-07
这里有10条数据:
X(穿鞋睡) | Y(喝酒) | Z(头疼) |
---|---|---|
1 | 1 | 1 |
1 | 1 | 1 |
1 | 1 | 1 |
1 | 1 | 1 |
0 | 0 | 0 |
0 | 0 | 0 |
0 | 0 | 0 |
0 | 0 | 0 |
1 | 0 | 0 |
0 | 1 | 1 |
计算使用干预和不使用干预的ATE(average treatment effect),也就是estimate causal effect
不干预:(计算条件概率)
(实际上叫associational difference,才是ATE(或者causal difference))
计算
计算
其中
下面还要用到
干预:(do-operation)
计算
计算
总结
可以看出来,不用干预,得到的ATE是3/5,表示存在X对Y因果效应,这当然是错误的,因为被Z混淆了。
使用干预后,得到的ATE是0,表明X对Y没有因果效应。
两个公式的区别就是下面变成了。一方面是do之后,backdoor没了,X和Z独立,所以,另一方面:,相当于如果让强行等于,就达到了,也就是“修改了数据”,让数据中没有穿鞋睡的人穿鞋了,也就是pearl说的,条件概率是改变看世界的角度,干预do改变了世界。
疑问
我们通过对已观测的数据进行干预,得到的ATE,和我们真正进行随机对照试验(RCT)后得到的ATE有什么本质上的区别?(跟我开头那个疑问有点联系)
网友评论