美文网首页
三种 Matching Method

三种 Matching Method

作者: 数科每日 | 来源:发表于2021-02-21 18:25 被阅读0次

    不同与 Complete Randomize 的研究方法, Fully Blocked 方法更加稳定。 Fully Blocked 引申出三种 可以用于 Observational Research 的 matching method. 利用Matching 可以找到隐藏在 Observational Research 中的 Randomized Experiment

    0 Matching 的核心思想

    • 创造出一种“距离”, 用来测量 control observation 和 treatment observation 的距离。
    • 对近距离的 C-T 配对, 之后可以用来 Compare

    以下三种方法,主要是在计算距离时方法不同。

    1 Mahalanobis Distance Matching

    • 使用 Mahalanobis 距离, 和欧式距离很像, 但是 S^{-1} 指的是对值做一下标准化
    • 有最长距离限制,超过最长距离的 maching 都会被 pruned 掉
    • 没有配上对的 C, T全部扔掉
    • 剩下的C-T 对就可以用来做分析
    image.png image.png

    2 Corasened Exact Matching

    • 不计算距离,但是对连续的 Feature 进行bin, 被分在同一个 grid 中的CT 视为可以配对的observation。
    • bin 的大小, 看实际需求, 可以调整bin 的大小。
    • 没有配对的 C, T 会被丢掉。
    • Compare 的时候, 不用bin, 还用原来的数值。 bin 只用来分组
    image.png image.png

    3 Propensity Score Matching

    • 利用 Propensity Score 来计算距离
    • 用不到, 匹配不上的 observation 全部丢弃
    • 距离过大的 pair 丢弃
    • 实际是把高维数据映射到1维
    • 距离近C,T 以随机方式分组
    • 是一个次优的matching
    • 实际中最常用的 matching (可能是可以打破 high dimension curse)
    image.png image.png

    摘录自
    https://www.youtube.com/watch?t=910&v=tvMyjDi4dyg&feature=youtu.be

    相关文章

      网友评论

          本文标题:三种 Matching Method

          本文链接:https://www.haomeiwen.com/subject/zovqfltx.html