美文网首页自然科普
因果关系 | 之,大量悖论

因果关系 | 之,大量悖论

作者: FanlyLee | 来源:发表于2020-11-10 15:52 被阅读0次

行动超越了言论的人,其言论将经久不衰。-拉比·哈宁拿·本·杜莎


接着前面两篇文章,原本计划这篇要写写因果关系之人工智能的。不过,前几日,收到读者朋友的反馈,说:“谈到因果关系,一定不能少了辛普森悖论”。我想了想,的确,辛普森悖论属于典型的因果关系知识体系。

那么,今天我们就来说说和因果关系相关的悖论吧。显然,不止一个悖论。

01

蒙提·霍尔悖论

20世纪80年代末,有位叫玛丽莲·沃斯·莎凡特的作家开始在《大观》(Parade)杂志上撰写固定专栏,该杂志是《星期日报》的增补版,在美国许多城市发行。她的专栏“问玛丽莲”连载以来,主要内容是为读者提出的各种难题、脑经急转弯和科学问题提供她的解答。

这本杂志将她称为“世界上最聪明的女人”,这无疑激发了众多读者的斗志,纷纷尝试想要提出能难倒她的问题。

在她回答的所有问题中,一个引发了激烈争论的问题出现在1990年9月的专栏中,这个问题就是著名的“三门问题”。

三门问题(Monty Hall problem)亦称为蒙提霍尔问题、蒙特霍问题或蒙提霍尔悖论,大致出自美国的电视游戏节目Let's Make a Deal。问题名字来自该节目的主持人蒙提·霍尔(Monty Hall)。

参赛者会看见三扇关闭了的门,其中一扇的后面有一辆汽车,选中后面有车的那扇门可赢得该汽车,另外两扇门后面则各藏有一只山羊。当参赛者选定了一扇门,但未去开启它的时候,节目主持人开启剩下两扇门的其中一扇,露出其中一只山羊。主持人其后会问参赛者要不要换另一扇仍然关上的门。

问题是:换另一扇门是否增加参赛者赢得汽车的几率?

沃斯·莎凡特在她的解答中认为参赛者应该选择换门。不换门的话,赢得汽车的几率是1/3。换门的话,赢得汽车的几率会翻倍,变为2/3。

这位“世界上最聪明的女人”大概没有预料到接下来发生的事情。几个月里,她收到了1万多封读者来信,他们中的大多数人都不同意她的回答,其中许多读者自称拥有数学或统计学的博士学位。

查尔斯·里德博士:“我建议你找本标准的概率论教科书参考一下,然后再试着回答这类问题。”

美国陆军研究所(US Army Research Institute)的埃弗雷特·哈曼(Everett Harman)写道:“如果连博士都要出错,我看这个国家马上要陷入严重的麻烦了。”

斯科特·史密斯博士:“你搞砸了,彻底搞砸了!”

甚至有些辱骂的声音:“我看你就是那只山羊!”

但是莎凡特并没有错。最后她用整整4个专栏,数百个新闻故事及在小学生课堂模拟的测验来说服她的读者她是正确的。“哦,那真是太有趣了。实际上我十分享受这些讨厌的来信,”她说。“这些家伙我真是爱死他们了!”

即使在今天,许多人在第一次看到这个谜题时仍然会对这一结果感到难以置信。换门赢车的概率不是1/3吗?怎么会是2/3?

为什么?我们的直觉到底哪里出了错?

朱迪亚·珀尔认为,最有说服力的理由是:沃斯·莎凡特的解决方案似乎迫使我们相信了心灵感应的存在。

如果无论参赛者在最初选择了哪扇门,都应该在之后换门,那就意味着制片人在某种程度上读懂了参赛者的心思。否则,他们是怎么安排汽车位置的,将其准确地放到了参赛者最初更不可能选择的那扇门的后面呢?

02

伯克森悖论

1946年,梅奥诊所的生物统计学家约瑟夫·伯克森指出了在医院进行的观察性研究的一个特性:两种疾病即使在一般人群中彼此不存在实际联系,在医院的病人中也会形成某种似是而非的关联。

案例是这样的。两种疾病是呼吸系统疾病、骨骼疾病,我们分别用疾病1、疾病2来表示前后两者。无论疾病1还是疾病2都没有严重到需要患者必须住院的地步,但两者结合起来就会导致患者必须住院。

我们的预测是在住院病人这个总体中疾病1与疾病2高度相关。在此前提下,在针对住院病人进行研究时,我们就相当于控制了“住院”这个因子。以对撞因子为条件这一操作制造了“疾病1”和“疾病2”之间的伪相关。

因为辩解效应的存在,这种伪相关多呈负相关,但在这个例子中,这种伪相关是正向的,因为患者住院的前提就是同时患有两种疾病,而不是只患有一种疾病。

流行病学家拒不相信这一悖论的存在。直到1979年,麦克马斯特大学的一位研究统计偏倚的专家大卫·萨克特,提供了强有力的证据,证明了伯克森悖论是真实的。

他的研究表明,在一般人群中,大约有7.5%的人患有骨骼疾病,这一比例与患者是否患有呼吸系统疾病无关。但是,对于患有呼吸系统疾病的住院患者而言,其骨骼疾病的患病率会升至25%!萨克特称这种现象为“住院率偏倚”或“伯克森偏倚”。

对撞的扭曲棱镜在日常生活中普遍存在。我们比较熟悉的一个案例出自,乔丹·艾伦伯格《魔鬼数学》(How Not to Be Wrong):你有没有注意到,在你约会的人当中,那些有魅力的人往往是混蛋?

与其为解释这一现象而费力构建复杂的社会心理理论,不如考虑一种更简单的解释。

你对约会对象的选择取决于两个因素:魅力和个性。你会冒险约会一个刻薄而有魅力的人,或者一个和蔼但缺乏魅力的人,你当然也会与一个既和蔼又有魅力的人约会,但你肯定不会与既刻薄又没有魅力的人约会。

换句话说,你删掉了所有“负——负”的结果,而正是这种筛选,造成了魅力与个性之间的伪负相关。

可悲的事实是,没有魅力的人可能会和有魅力的人一样刻薄,但你永远意识不到这一点了,因为你永远不会约会既刻薄又没有魅力的人。

03

辛普森悖论

这一悖论是在1951年由一位叫爱德华·辛普森的统计学家发现的,它困扰了统计学家60多年,时至今日仍未得到彻底解决。

辛普森在阅读文献时发现了一种很有前途的新药,这种新药似乎可以降低心脏病发作的风险。当他看到男性患者数据时,他注意到如果这些患者服用这种药物,他们心脏病的发作风险反而更高了。有些失望,他想“哦,好吧。这样的话,这种药一定对女性非常有效。”

随后,当他看下一份表单时,失望变成了困惑:“这是怎么回事?”他大叫:“数据显示,服用这种新药的女性患者的心脏病发作风险也变高了!我一定是神志不清了!这种药似乎对男性有害,对女性也有害,但对人类有益。”

这太荒谬了,这三句话中一定有一句是错的。但错的是哪一句?为什么?

这项研究是观察性的,不是随机对照研究的。观察对象是60名男性和60名女性。患者自己决定是否服用药物。在女性患者中,对照组(未服药)中有5%的患者后来心脏病发作,而处理组(服药)中有7.5%的患者后来心脏病发作。因此我们认为,这种药物与女性患者中较高的心脏病发作风险有关。

在男性患者中,对照组中有30%的患者后来心脏病发作,而处理组中有40%的患者后来心脏病发作。因此我们认为,这种药物与男性患者中较高的心脏病发作风险有关。

但当我们看总体数据时,在对照组中,有22%的患者后来心脏病发作,但处理组中的这一比例仅为18%。因此,根据这个数据判断,这种新药似乎的确降低了整个患者群体的心脏病发作风险。

因为一种药物不可能既导致心脏病发作又防止心脏病发作,这是让人会大叫的原因。

虽然数学能够证明,这并不矛盾。然而,这种直觉是普遍的,我们在2岁左右就发展出了这种直觉,远远早于我们开始学习数学和分数的年龄。

关于辛普森悖论,我们再举一个例子。

如果对棒球感兴趣的读者朋友,可能会知道大卫·贾斯蒂斯和德雷克·杰特。

1995年,贾斯蒂斯的平均击球率比杰特的要高,二人的击球率之比是25.3%:25%。1996年,贾斯蒂斯依然有相对较高的击球率,二人的击球率之比是32.1%:31.4%。1997年,贾斯蒂斯在第三赛季的击球率仍然高于杰特,二人的击球率之比是32.9%:29.1%。

然而,当我们把所有三个赛季的击球率数据合并时,结果却显示,杰特有更高的击球率!

等一下,一个球员在1995年、1996年和1997年三年的时间里都比另一个球员打得差,他在三年里的总体表现怎么可能反而比对方更好呢?事实上,这是不可能的,问题出在我们使用了一个过于简单的词——更好,来描述不均匀赛季中复杂的平均过程。

根据记录,总打数在不同年份中并非均匀分布。一方面,杰特1995年的打数很少,所以他在那年很低的击球率几乎没有影响到他的整体平均成绩。另一方面,贾斯蒂斯在他击球率最低的1995年里的打数更多,这就拉低了他的整体击球成绩。

一旦我们意识到“更好的击球手”不是由两位击球手之间的正面交锋来定义的,而是由将每位击球手的上场频率计算在内的加权平均成绩来定义的,那么,这种对于逆转结果的差异就会很快消退。

看到这里,有没有一种熟悉的感觉,加权平均的算法会导致我们直觉的强烈冲击,就像我们上篇文章《因果关系 | 之,贝叶斯网络》提到的,检测报告呈现阳性时,实际上,患有乳腺癌症的几率不到1%。

第一个注意到这一直观原则存在的人是统计学家伦纳德·萨维奇,他在1954年称其为“确凿性原则”(sure-thing principle)。

他意识到“确凿性原则”是外在于逻辑的。实际上,正确的解释建立在因果逻辑之上,而非建立在经典逻辑之上。

-THE END-

相关文章

  • 因果关系 | 之,大量悖论

    行动超越了言论的人,其言论将经久不衰。-拉比·哈宁拿·本·杜莎 接着前面两篇文章,原本计划这篇要写写因果关系之人工...

  • 犯罪构成之因果关系-附思维导图

    学子 CH 的法学学习笔记 文字提纲 犯罪构成之因果关系(文字提纲).png 思维导图 犯罪构成之因果关系 (思维...

  • 天道可说,不可说

    天道可说,不可说,是悖论,也非悖论。 可说自有时空。春之桃花开,那是花说花语。及至夏,就是桃果之语了。到了秋风肃杀...

  • “双生子效应”是"悖论"或者是"佯谬"?

    ——“双生悖论”随笔之八 “双生悖论”,其实不“悖”;“双生佯谬”,其实无“谬”。 这一组文章就是围绕“双生子效...

  • 【悖论】(之四)

    这里有一个象征性的伪命题: 假如某某给您一千万现金或相当于这个数额的图书馆,只能是二选一。那么您会如何选择呢?大多...

  • 【悖论】(之五)

    一万种应对办法也难抵坚如磐石?

  • 悖论之惑

    【一】 提到悖论,很容易想到这句话:“我说的这句话,是句谎言”。如果这句话是真的,那么,这句话就是一个谎言,如果这...

  • 人性之悖论

    人性最大的悖论就在于:越稀缺,越匮乏;越富足,越盈余。 商业的本质在于交换,以物易物是商业的最初形态,随着社会形态...

  • 【悖论】(之八)

    愈是认为可以认识别人,愈是难以认识自己;同理,愈是认为自己可以代表甚至取替别人,愈是难以确认别人是否知道自己是谁;...

  • 【悖论】(之六)

    如果我们一味沉溺或纠结于同质或异质的形而上思辨的漫野泥淖之中,那么,我们就是绝对的傻瓜蛋;因为如果那样的话,您就会...

网友评论

    本文标题:因果关系 | 之,大量悖论

    本文链接:https://www.haomeiwen.com/subject/tpsjbktx.html