第二部分:以偏概全
小数定律
系统1非常擅长一种思考形式——它自动且不费力气地定义随机事件之间的联系,甚至这些联系根本就是虚构的。
根据定义,一个随机事件是不需要解释的,但是一连串的随机事件就有规律可循。然而,当系统1面对“纯统计学”的数据时是束手无策的,因为这些数据只能改变结果的出现概率却不能直接导致结果发生。系统1只能感受到后者。
在统计学理论中,相比于大样本,极端的结果更容易出现在小样本中。这样的解释不存在因果联系。你早就知道应该更相信大样本,但是“知道”并不能决定你能很好地用它。书中举了个例子:
一项研究对美国3141个县的肾癌发病率进行了调查,调查显示该病的分布模式很值得注意。发病率最低的县差不多都位于中西部、南部和西部人口稀少的乡村,这些区域按照惯例由共和党管辖。对此,你有何看法?
一个统计学家评论道:“人们很容易做出推断,认为肾癌发病率低主要是忧郁乡村的生活方式很健康”。假设把上面的发病率“最低”改成“最高”,那么情况会是:“人们很容易作出推断,导致肾癌高发病率的直接原因是乡村生活的贫困”。显然,这两观点是矛盾的,乡村的生活方式不可能既是发病率高的原因又是发病率低的原因。问题的关键就在于乡村人口稀少,样本小,出现极端样本的可能性大,产生高发病率或低发病率都没有什么好解释的。然而很多人在读上述例子的时候不会立刻注意到“人口稀少”这一特点。这就是系统1不会用统计学思维思考问题的表现。即便要一个人确定下面两个陈述句说的完全是一回事,也要他调用系统2,费好些脑力:
—— 大样本比小样本更精确
—— 小样本比大样本产生极端结果的概率大
很多人读完第一句都不会有什么疑问,直到感受到第二句的意思,你才真正明白之前第一句在说什么。
人们对样本大小没有足够的敏感性,这让我们阅读新闻和新闻来源时容易被误导,比如:
在一次面向300名老年人的电话民意调查中,有60%的人支持总统。
不管样本是150还是3000,大家都会得到相同的结论:“老年人支持总统。” 显然,这么少的样本,而且只是电话调查这一种方式,出现极端样本的概率是很大的,所以这个60%的数据根本就不可信。而书中第一部分的“眼见为实”的原则表明,你看到什么就会倾向相信什么的,你甚至无法完全区分“我在《纽约时报》读到。。。”和“我在办公室闲聊中听到。。。”这两种信息来源有什么不同。
小数定律是偏见的一种表现,即对事物的信任多于质疑。仅仅因为小样本是取自整体的一部分,就相信小样本能反映整体样貌,这是非常顽固的以偏概全思维,这和中国人说的“盲人摸象”、“管中窥豹”差不多。不光是普通人,就算是专业人员也容易掉进这个坑。许多研究人员过于相信通过有限的几次观察所得出的结果,这一现象与光环效应(第一印象)紧密相联。
不仅在小数上以偏概全,人们对随机事件发生概率的判断也是经常犯错。比如,抛6次硬币,考虑一下可能的结果:
正正正反反反
正正正正正正
正反正正反正
出现这些序列的可能性是一样的吗?人们本能反应都是觉得第三种序列的可能性比前两个大,但事实是反直觉的。硬币的正反面出现顺序的概率相等,都是(1/2)**6(二分之一的六次方)。
除了错误估计随机事件概率,人们还喜欢给一系列随机事件找规律和解释。比如篮球比赛中“投篮顺手”连续进球就是一个影响深远的认知错觉。
小结:
— 过分对小样本的信任只是众多错觉中的一种。其他常见错觉还有:比起信息的可靠度,我们更注重信息的内容,好让我们理解的世界比数据证明的世界更加简单和前后统一;我们对在臆想的世界中做出快速结论非常有把握,而不去了解真实的世界。
— 统计数据会产生很多貌似能给出因果解释的观察结果,但其实这些结果都是不需要解释的随机事件。世上许多事实其实都是巧合,包括做统计时信息采样的偶然性。对偶发事件做出因果关系的解释必然都是错误的。
典型性判断VS概率逻辑
典型性判断属于一连串可能同时发生且联系紧密的基本评估,最具典型性的结果与特征描述结合在一起就会生成最有条理的信息。这是系统1的强项。而这些最具条理的信息却不一定就是可能性最大的。书中最著名也最受争议的实验就是讨论这个概念的。作者虚构了一个叫Linda的女士,并对她进行了如下描述:
琳达,31岁,单身,一位直率又聪明的女士,主修哲学。在学生时代,她就对歧视问题和社会公正问题较为关心,还参加了反核示威游行。
实验给受试者看了一张列有Linda可能会出现的8种情况的单子,并要求人们用出现概率排序:
Linda是小学老师
Linda在书店工作,她还在学瑜伽
Linda积极参与女权运动
Linda是妇女选民联盟成员
Linda是银行出纳
Linda是保险推销员
Linda是银行出纳,还积极参与女权运动
排序结果表明,所有人都认为Linda更可能是一个“主张女权主义的银行出纳”,而不是普通的银行出纳。典型性直觉告诉我们,Linda的特征十分符合这个选项,但是这个判断显然有违概率逻辑——积极参与女权运动的银行出纳的子集被包含在银行出纳的大集合中,因此,前者的概率一定比后者低。因此这个问题使典型性直觉和概率逻辑这两者对立了起来。而且直觉经常战胜逻辑。
得到这个重大发现后,作者扩大了实验规模,并且对斯坦福大学商学院决策科学项目的博士生发了同样的调查问卷。这些受试者可都是学过概率论、统计学和决策论高级课程的,然而实验结果令人惊讶——85%的博士生也认为“积极参与女权运动的银行出纳”比普通“银行出纳”的可能性更大。
这个实验后来又更进一步,它排除了其他选项,直接问这个简单的问题:
下面哪种情况可能性更大?
Linda是银行出纳
Linda是银行出纳,同时她还积极参与女权运动
面对这么直接了当的问题,几所重点大学中85%~90%的大学生还是选择了第二个选项,这一选择有悖逻辑,但却没有人因此感到羞耻。可见在系统1面前,分析概率和逻辑的系统2是多么没有份量。很多时候,即使正确答案就在眼前,直觉也会打败逻辑。
回归平均值(regression)
回归平均值是概率学里面一个重要的概念,既高于或低于平均状态的,都会以很高的概率向平均值回归。这个理论在股票价格,社会现象,天气变化,运动员表现等等方面都能体现。这个普遍的现象却很少有人在日常生活中意识到,大部分人还是会用因果关系去思考问题。运动员在球场上的表现起起落落,并不会因为受到批评或者表扬就会在下一次表现更好。他的表现永远会在平均水平上下浮动,浮动得越大,下一场反弹的概率也就越大,而平均水平只取决于他平日的训练水平和身体状态,不取决于他的单场表现或所谓的“心态调整”。
如果你对未来的事情想做出一个相对靠谱的预测和判断,就必须尽可能地通过更多信息去获得基础概率,平均值,而不是用典型性直觉去做决策。一个理性的风险投资家知道,即便是最有前景的新建公司,其成功概率有只是中等水平而已。我们的系统1用眼前可见的极少信息去编造一个貌似连贯的故事,用简单的问题去替换去替换复杂的问题,这些做法都会让我们对错误的判断信心满满。书中给出了直觉性预测和回归平均值的几个示例:
“那家新成立的公司已经深入人心了,但我们不能指望他们将来也能做得这么好。他们的营销之路很长,回归的空间也很大。”
“我们的直觉性预测的确令人鼓舞,但这个预测可能离现实太远了,还是让我们再看看手中的信息资料,让预测回归到平均状态吧。”
“我读过关于那个品牌的一篇评论,评价极高,然而这很可能只是侥幸成功。我们应该这样想:对这个品牌的评论很多,而我们看到的这个正巧是评价最高的。”
本书第二部分又一次说明了,在很多情况下,系统1会做出并不理性的选择,而且我们大脑里很难形成概率性和逻辑的思考。即便是这个专业的博士生,也难免掉进系统1的坑里。概率思维和逻辑分析是投资里面非常重要的技能,这也是本书最让我受益的地方,因为读这么多年书从来没人教过我这些知识,也没有人提醒过我它们的重要性。投资不仅是增长财富的手段,更是自我升值中的一系列决策的过程。我们从来都是被教予做解答题的方法,却没人教我们做选择题。这本书让人了解到运用概率思维和逻辑思考去做好选择题是多么困难的事。而正因为只有少数人会,所以它才价值更高。想要成功,并不是在竞争激烈的解答题高手中脱颖而出,而是去做一个只有少数人参与的选择题高手。
网友评论