第二十一章《直觉判断与公式运算,孰优孰劣?》讲述为什么公式运算优于专家的直觉判断,提出了两个理由
1)试图变得聪明,总想跳出思维的框框,在预测时会考虑将不同特征进行复杂的结合。复杂化对稀奇古怪的事情是有影响的,但十有八九会降低其正确性,将这些特征简单的整合在一起反而会更好。
2)人们对复杂信息的最终判断很难达成一致。
作者提出,要提升预测的准确性,最终的结果应由公式给出,在低效的情况下尤其如此。
这一章中最经典的一个公式:婚姻的稳定性可以通过一个公式来预测,做爱的频率,减去吵架的频率。
拆页十六
来自第二十一章《直觉判断与公式运算,孰优孰劣?》
P208
“闭上眼睛”的直觉判断比主观判断更可取
1955年,作为以色列国防军中一个21岁的陆军中尉,我接受指派为全军建立一套测试系统。你也许会惊讶为什么会将如此重任交给我这么年轻的人,但请记住,以色列当时建国才7年,国内所有的机构都在筹建当中,必须有人去建设。今天听来有些奇怪,我的心理学学士学位竟然能够证明我有能力成为军中最训练有素的心理学家。我的顶头上司是一个才华横溢的研究者,他拥有化学学士学位。
当我接到任务时,例行面试已经准备就绪。每一个入伍的士兵都要完成一系列理素质测试,对那些有作战任务的士兵要进行个性评估。我们的目标是要给这些新兵对作战适应性打一个分,并在步兵、炮兵、装甲兵等兵种中给他们选择一个最适合他们个性的兵种。面试官们本身也是新兵,之所以被选中做面试官是因为她们智商高,喜欢与人打交道,她们中的大多数人是当时不必参战的女兵。经过几周培训后,她们学会如何安排一个15-20分钟的面试,培训人员还鼓励她们要覆盖多个话题,而且要尽量对被测试者日后在军中的表现情况形成一个整体的印象。
不幸的是,接下来的评估已经显示这种测试过程对预测新兵日后成功与否毫无用处。于是他们要求我设计一个更有用但不会更耗时的测试。他们还要求我设计新的面试方法,并评估这个方法的准确性。从专业角度来讲,这些任务的难度与让我建一座横跨亚马孙河的大桥差不多。
幸运的是,我读过保罗•米尔那本一年前出版发行的“小书”(《让我烦恼的小书》)。我很相信书中的论证,认为简单的运算法优于临床的直觉判断。我总结出,当前的面试之所以失败,部分原因是它允许面试者按照个人的喜好作决定,这个决定会因面试者的心理活动而发生一些变动。相反,我们应该用限时的项目来获得受试者在正常环境下更具体的信息。我从米尔那里还学到了我们应该摒弃这种用面试者的整体评估来给新兵打分的方法。米尔的书中指出这种评估不值得相信,而运算法从分散的评价中得出的结果则更有价值。
我决定采用这样的过程,面试者要评估几项相关个性特征,为每项单独打分。最后的作战适应性结果由计算机根据一个特定的公式给出,面试者不干预。我列了表格,其中包含与作战表现相关的6个特点,包括责任心、社交能力以及男子气概等。之后我再针对每个特点整理出一系列关于他们入伍之前生活的问题,例如之前做过几份工作,工作和学习时是否准时,和朋友交往的频率,以及他的兴趣爱好和参加过的运动等,这便使我能尽量客观地从每个角度对新兵进行评估。
通过这些标准化的真实问题,我希望能够排除光环效应,排除人们喜好的第一印象对判断结果的影响。为了进一步预防各种光环的影响,我要求面试官依照固定的顺序去测试这6个特点,在测试下一个特点之前要对前一个特点按5分制打分,我告诉他们不要为新兵在部队的未来发展操心。他们唯一的工作就是找出与新兵的过去相关的信息并以此来给每一个特性打分。“你们的作用就是提供可靠的测定值,”我说,“处理预测有效性的工作让我来。”我这句话的意思是我要用公式来整合他们的具体得分。
面试官们齐声抗议这种安排。这些优秀的年轻人对我这个和他们差不多大的中尉的命令有点不情愿,毕竟这样的要求禁止他们运用直觉,将注意力完全放在一些无聊的真实问题上。其中一个人抱怨说:“你在把我们变成机器人吧!”所以我妥协了,“按照要求进行测试吧,”我说,“请完全按照要求来进行测试,测试完后,就像许愿那样闭上眼睛,将新兵想象成一个战士,并给他打分。”
我们对几百次面试都采用了这个新方法。数月之后,我们收集了新兵指挥中心对他们表现的评价,这使我们很欣喜。正如米尔的书中提到的那样,新的测试过程比原来的过程有质的飞跃。虽然离完美还有一定差距,但6项指标整合起来作出的预测比之前的整体评估要准确得多。我们已经从“徒劳”进步到了“有效”。
面试官“闭上眼睛”后的直觉判断也很谁确,甚至和整合6项指标得到的运算结一样准确,这是我最为惊喜的地方。我从这一发现中学到了毕生难忘的一课:即使是不那么正规严肃的遵选面试,直觉也会起到积极作用,当然前提是按照规定收集客观信息并对不同特性进行独立评分。我建立了一个给予“闭眼”评估和整合6项指标同等权重的公式。从这件事中我学到一个普遍规律:不要简单地相信直觉判断——无论是你自己的还是他人的—但也不要完全抛开它。
45年后,我获得了诺贝尔经济学奖,在以色列一时间也小有名气。在一次访问中,一些人想带我看看旧时服役的军事基地,那里依然矗立着测试新兵的房子。有人把我介绍给心理组的司令部官员,她向我介绍了目前的测试方法,和我当时设计的没有什么两样。在那里,大量研究显示该测试依然有效。最后在介绍如何引导面试官时,她补充道:“我们告诉他们,‘闭上你们的眼睛’。”
本章的内容已经在部队人力测试以外的项目中也得到了应用。
「I,重述知识」
请梳理拆页中制定面试测试规则的步骤。
拆页中的面试测试由原来的直觉判断改变到通过测评特定要素并赋值,再进行综合运算的科学测评方法,这种方法被实践证实切实有效。它分为以下几步:
1.根据测评目的,确定测评要素。本案例中确定了6个测评要素,如责任心、社交能力和男子汉气概等;
2.对测评要素设计量化评分表及评分规则。如每项5分,并且按顺序进行测评,并严格按照评估表打分。
3.培训面试官。
4.根据面试官反馈,修订规则,允许测试完后其闭上眼睛依据直觉给分。
5.统计测算分值,给出测评报告。
「A1,激活经验」
类似的测试规则,你曾经做过哪些,比如你去超市买洗发精,你的测试规则是什么;比如你挑选一个和家人聚餐的酒店,你的测试规则是什么;工作中,比如你要组织公司年会,你挑选会场酒店的测试规则是什么?
我女儿经常站在琳琅满目的商品前,犹豫不决,难以选择。我将她定义为说选择困难症患者,我唯有使用杀手锏:一分决策否则放弃,来对付她。
考试结束后,允许她买一样零食,她选了薯片,可是看着那么多款式,她又难住了,于是我教她:
第一、你最不喜欢什么口味和品牌排除它(最不喜欢芝士和辣味);
第二、剩下的哪些吃过,哪些没吃过。
第三、买吃过的最喜欢的(容易选,不费事)还是买没吃过的(尝新,下次可以多个选择)?
第四、买后根据口味好吃程度优化下次的选择。
虽然这个过程没有列出选择评分,但运用的道理差不多,以口味好吃程度做为评判标准,以购买的重复率来验证喜好程度,孩子就比较容易进行选择。
「A2,规划运用」
想一想,你有那件事或者哪类事情做起来有点把握不定,试试能将其中的规律做出测试公式。
如果手上同时有几件任务要处理,那究竟应该先做哪件,怎么分配时间,怎么协调精力,一般凭感觉判断可能会出错,比如今年的研究生国家考试,我就低估了所需投入的时间和精力,导致复习不充分,面临重考的风险。所以,我总结的经验是:
1.核算总体任务量,比如考试的1门功课,共九章40节;
2.检测、评估每日可投入做任务的有效时间和时段:每日实际可投入得有效时间为1小时,1小时内可阅读及背诵最多2节;
3.测算完成任务的总时长:1小时*40节/2=20小时(乐观情况下);
4.评估风险或损耗系数:一周可能有2天不能按计划实施,损耗系数为2/7*100%=29%
5.计算有效执行任务的总周期:20/(1-29%)=28小时,按每天1小时有效投入,保守估计需要28天,而且必须保证不复习的天数控制在每周2天。
这么一推算,我就可以清楚知道每天要完成的学习任务,就不会再“临时抱佛脚”,来不及复习了。
网友评论