基本比率谬误(base rate fallacy),是指对统计学上的基本比率不敏感导致的推论谬误。
基本比率对概率有重要影响。这很好理解:买矿泉水的人多呢,还是买香奈儿香水的人多?人群和需求概率明摆着,简直不是问题。但是人们往往会通过代表性来评估概率,忽视基本比率。代表性的意思是,通过比较 B 与 A 的相似程度来评估概率。例如,如果 A 能高度代表 B,人们就会认为 A 源自 B 的概率高。但如果 A 与 B 并不相似,人们就会认为 A 源自 B 的概率低。
image例子1
特沃斯基和卡尼曼提出一个假设:如果人们通过代表性来评估概率,基本比率就会被忽视。
他们设计了一个实验,向被试者简要概述了几个人的性格,这几个人是从100位工程师及律师的样本中随意抽取出来的。被试者需要通过对每个人的描述,来评估他是工程师还是律师。
在情境 A 中,受试者被告知这些被描述的 100 人中,有 70 位工程师、30 位律师。而在情境 B 中,被试者被告知这 100 人中,有 30 位工程师、70 位律师。情境 A 的被试者判断任意一个描述是关于工程师的而不是关于律师的概率,都应该高于情境 B。因为情境 A 中工程师更多,情境 B 中律师更多。然而,这些被试者在这两个实验情境中都得出了同样的概率判断。很明显,被试者认为某个特定的描述是针对工程师而非律师,他通过这两个典型职业的代表程度来判断,而没有考虑到其所属类别的基本比率。
image在没有人物描述的情况下,被试者能判断某个人是工程师或律师的概率分别是 0.7 和 0.3,这与基础比率正好符合。然而,当某个描述存在,就算这个描述没有任何信息,基本比率还是会被彻底忽略掉。比如:
迪克是位30岁的男性,已婚,但无子女。他能力强,干劲足,承诺一定要在自己的领域功成名就。他很受同事的欢迎。
这个描述其实与迪克是工程师还是律师的问题完全没有关系,迪克是工程师的概率,应该与工程师占样本总人数的比率相同,就如同我们没有得到任何有关迪克的描述时一样。然而,被试者却将迪克是工程师的概率判断为0.5,并不关注工程师占总人数的比率是 0.7 还是 0.3。很明显,在没有任何证据和得到了一些无用的证据之后,人们的回应是不同的。在没有任何特定证据的情况下,基本比率能够被合理地应用;而在得知一些无用证据的情况下,基本比率就会被忽略。
例子2
这个例子来自 「Smart Choices: A Practical Guide to Making Better Decisions」一书。
imageJack 已经退休。那么他是图书馆员还是推销员?
对这个问题典型的反应是:“哦,很清楚,他是一个图书管理员。图书馆员很可能会退休;推销员通常很外向很有活力。他是一个图书管理员的可能性至少有 90%。” 虽然听起来很合理,但其实完全错误。
这个逻辑的问题是忽略了基本概率:男性推销员比男性图书馆员多得多。事实上,在美国,男性销售员数量是男性图书馆员的 100 倍。在考虑“退休”这一事实之前,Jack 是图书馆员的可能性只有 1%。
接下来才轮到“退休”。假设一半的男性图书馆员都会退休,而推销员退休的比例只有 5%。即便这样,每 10 个销售员退休,才有 1 个图书管理员退休 - Jack 是一个图书管理员的比率提高到 10%。
最初的直觉告诉我们,这个概率是 90%。可见忽略基本比率会引起严重的偏差。
记得,凡事逃不过基本比率。
练习
假设同性恋染上 G 病的概率是异性恋的 9 倍,张三染上了 G 病,而我们对他的性取向一无所知。试问张三是同性恋的概率是多少?
如果回答 90%,恭喜你又犯了基本比率谬误。
事实上,如果我们不清楚同性恋和异性恋占整个群体的比率(即基本比率),就无法回答这个问题。
为方便起见,我们假定群体有 100 人,同性恋有 10 人(占 1/10 ),异性恋有 90 人(占 9/10 )。再假设异性恋染上 G 病的概率是 X,则同性恋染上 G 病的概率为 9X。我们可用下表表示各子群体的分布:
那么张三是同性恋的概率是:
来自直觉的概率判断(9/10),只有在同性恋与异性恋比例相等时才适用。假定群体有100人,同性恋、异性恋各50人,则可用下表表示各种子群体的分布:
此时,张三是同性恋的概率是 90%:
小结
学好概率很重要啊!
参考资料
- Hammond, J. S., Keeney, R. L., & Raiffa, H. (2002). Smart Choices: A Practical Guide to Making Better Decisions (unknown edition). New York: Crown Business.
- Pohl, R. F. (2012). Cognitive Illusions: A Handbook on Fallacies and Biases in Thinking, Judgement and Memory. Psychology Press.
- 丹尼尔·卡尼曼. (2012). 思考,快与慢. (胡晓姣, 李爱民, & 何梦莹, Trans.). 中信出版社.
- Base rate fallacy. (2016, October 7). In Wikipedia.
Kidult00 的心智乐高专题将持续寻找并学习不同学科重要的模型和“知识乐高”,帮助自黑党们更好地 Hack yourself。
网友评论