疑问

作者: 来到了没有知识的荒原 | 来源:发表于2021-04-14 20:50 被阅读0次

    为什么因果图上去掉了那条边,就意味着让未服药的女性也服了药。或者说怎么通过去了一条边达到了RCT(随机对照实验的效果)?

    2021-09-07

    这里有10条数据:

    X(穿鞋睡) Y(喝酒) Z(头疼)
    1 1 1
    1 1 1
    1 1 1
    1 1 1
    0 0 0
    0 0 0
    0 0 0
    0 0 0
    1 0 0
    0 1 1

    计算使用干预和不使用干预的ATE(average treatment effect),也就是estimate causal effect

    不干预:(计算条件概率)

    ATE=E[Y|X=1]-E[Y|X=0]
    (实际上E[Y|X=1]-E[Y|X=0]叫associational difference,E[Y(1)]-E[Y(0)]才是ATE(或者causal difference))
    计算E[Y|X=1]=4/5
    \begin{align} E[Y|X=1] & =P(Y=1|X=1)*1 + P(Y=0|X=1) * 0 \\ & =P(Y=1|X=1) \\ & =\sum_{z} P(Y=1,z|X=1) P(z) \\ & =\sum_{z} P(Y=1|z,X=1) P(z|X=1) \\ & =P(Y=1|Z=1,X=1) P(Z=1|X=1) +P(Y=1|Z=0,X=1)P(Z=0|X=1) \\ & =1 * 4/5+ 0* 1/5 = 4/5 \end{align}

    计算E[Y|X=0]=1 * 1/5 + 0 * 4/5 = 1/5

    ATE=E[Y|X=1]-E[Y|X=0] =3/5

    其中
    P(Y=1|Z=1,X=1) =1 \\ P(Y=1|Z=0,X=1)=0 \\ P(Y=1|Z=1,X=0) =1 \\ P(Y=1|Z=0,X=0) =0 \\

    下面还要用到

    干预:(do-operation)

    ATE=E[Y|do(X=1)]-E[Y|do(X=0)] \\

    计算E[Y|do(X=1)]=4/5


    \begin{align} E[Y|do(X=1)] & =P(Y=1|do(X=1))*1 + P(Y=0|do(X=1)) * 0 \\ & =P(Y=1|do(X=1)) \\ & =E_{z}[ P(Y=1|z,X=1)] (这一步来源于上图)\\ & =\sum_{z} P(Y=1|z,X=1) P(z) \\ & =P(Y=1|Z=1,X=1) P(Z=1) +P(Y=1|Z=0,X=1) P(Z=0)\\ & =1 * 1/2+ 0* 1/2= 1/2\\ \end{align}

    计算E[Y|do{X=0}]=1 * 1/2 + 0 * 1/2 = 1/2

    ATE=E[Y|do(X=1)]-E[Y|do(X=0)] =0

    总结

    可以看出来,不用干预,得到的ATE是3/5,表示存在X对Y因果效应,这当然是错误的,因为被Z混淆了。

    使用干预后,得到的ATE是0,表明X对Y没有因果效应。

    E[Y|X=1] = P(Y=1|Z=1,X=1) P(Z=1|X=1) +P(Y=1|Z=0,X=1) P(Z=0|X=1)

    E[Y|do(X=1)] = P(Y=1|Z=1,X=1) P(Z=1) +P(Y=1|Z=0,X=1) P(Z=0)

    两个公式的区别就是下面P(Z|X)变成P(Z)了。一方面是do之后,backdoor没了,X和Z独立,所以P(Z|X)=P(Z),另一方面:P(Z=1)=P(Z=1|X=1)P(X=1) + P(Z=1|X=0)P(X=0),相当于如果让P(Z=1|X=0)强行等于P(Z=1|X=1),就达到了P(Z=1)=P(Z=1|X=1),也就是“修改了数据”,让数据中没有穿鞋睡的人穿鞋了,也就是pearl说的,条件概率是改变看世界的角度,干预do改变了世界。

    疑问

    我们通过对已观测的数据进行干预,得到的ATE,和我们真正进行随机对照试验(RCT)后得到的ATE有什么本质上的区别?(跟我开头那个疑问有点联系)

    相关文章

      网友评论

          本文标题:疑问

          本文链接:https://www.haomeiwen.com/subject/qvillltx.html