幸存者偏差 - Survivorship Bias

作者: 科学俱乐会 | 来源:发表于2020-04-29 11:37 被阅读0次
    image

    什么是幸存者偏差

    二战期间,为了加强对战机的防护,英美军方调查了作战后幸存飞机上弹痕的分布,决定哪里弹痕多就加强哪里。然而统计学家 亚伯拉罕-瓦尔德(Abraham Wald)力排众议,指出更应该注意弹痕少的部位,因为这些部位受到重创的战机,很难有机会返航,而这部分数据被忽略了。事实证明,瓦尔德是正确的。

    幸存者偏差的研究

    简单的研究, 贝叶斯方法

    我们可以用贝叶斯方法来分析一下瓦尔德和众人的分歧出在什么地方,而谁的假设更为合理。

    设 X = 飞机的击中部位,Y = 1, 0 表示飞机是否返航。设空战中飞机的击中部位 X 的分布为 P(X),而返航飞机的 X 分布为条件分布 P(X|Y=1)。于是有

    image

    众人认为幸存飞机的击中部位分布 P(X|Y=1) 反映了空战中击中部位的分布 P(X),因此哪里弹痕多就要在哪里加强防护。但瓦尔德认为炮弹不长眼睛,空战中的 P(X) 应该是接近于均匀分布的。因此 P(X|Y=1) 恰恰是正比于 P(Y=1|X),即击中该部位 X 以后的返航概率。所以幸存飞机哪里中弹多,表明相应部位不是要害部位,而应该在返航概率 P(Y=1|X) 较小,亦即 P(X|Y=1) 较小的地方加强防护——正是幸存飞机中弹痕少的部位。

    真正的论文

    有一位匈牙利裔犹太人,后来去美国做研究, 亚伯拉罕·沃尔德(Abraham Wald). 他有一篇著名的论文, 专门研究这个问题 沃尔德的论文题目是:

    A Method of Estimating Plane Vulnerability Based on Damage of Survivors

    一种根据幸存飞机损伤情况推测飞机要害部位的方法。

    背景是这样的:

    当时诺贝尔奖经济学奖得主,弗里德曼,为美国海军研究炸弹试验方案时,卡在一个统计学问题上。弗里德曼求助犹太老乡沃尔德,问题迎刃而解。战后沃尔德拓展了这个问题,写成专著《序列分析》。

    弗里德曼把这段经历写入了自传,称赞道:「他(沃尔德)是一位杰出的统计学家,为统计学做出了创造性的贡献。」

    这里就不仔细说这个论文了, http://cna.org/sites/default/files/research/0204320000.pdf

    还有一个人研究他的论文 https://people.ucsc.edu/~msmangel/Wald.pdf

    总结

    幸存者偏差的概念,最简单来说就是:统计科目和样本是否能被纳入统计有相关性,所以样本呈现的结果和实际结果存在偏差。用白话说,活下来的才能让你看到,所以那些死掉的真实情况你无从得知,于是你只能看到机翼中弹返航的飞机、和股市里面赚几十倍的股神。

    所以这些也叫作 “不会说话的死人”,或“沉默的数据”

    随想:

    袜子总会丢一只

    因为两只袜子都丢了就不容易发现袜子丢了,所以往往注意到袜子丢了的时候都是只丢了一只袜子。

    高中教学研究

    大学生来探究高中教育的问题,那就忽略了高考这个筛选器:没有通过高考、没有考上大学的人,他们才是在高中教育真正出现问题的人,而他们不在大学生的研究样本中。

    参考文献:

    https://www.zhihu.com/question/21949175/answer/19938682

    https://www.zhihu.com/question/21949175

    相关文章

      网友评论

        本文标题:幸存者偏差 - Survivorship Bias

        本文链接:https://www.haomeiwen.com/subject/yfdgwhtx.html