《简捷启发式:让我们更精明》是德国的适应行为与认知(adaptive behavior and cognition,ABC)研究组所写就的一本研究报告集。不过在我看来,这本书其实讲的远不止豆瓣中所提到的机器学习、人工智能,对于人的学习与思维发展也有着较大的启发意义。
1、背景
简捷启发式的提出建立在全能理性的历史背景下,人们痴迷于古希腊时期的数学理性,渴望着用各种各样的数学模型来模拟现实世界。在这种背景下,多元回归等统计模型应运而生,甚至产生了拉普拉斯妖这样的科学神话。尽管后来出现了赫伯特·A·西蒙提出的有限理性理论,但人们对有限理性的误解又进一步导致了人们制造更复杂的模型的现象。
但现实生活中,真的需要这么复杂的模型吗?举个经典的问题,你妈和你女朋友同时掉水里了,你要救谁?作为一个正常人,显然不可能真的根据各种变量去求选择就那个的概率。时间和资源也不允许这样。但是,这是否就意味着我们的就没有办法在这种匆忙的状态下作出理性的选择呢?ABC研究组在研究的,也就是这种时间、知识甚至计算能力有限的情况下如何作出理性决策的方法。
2、适应工具箱
ABC研究组的研究基于这样一个观点:人类和动物的理性是有限的(既不是无理性,也不是完全理性),但这种有限理性并非人类进化中的缺陷。恰恰相反,这种有限理性让我们能够实现知识的更新,从而充分适应环境。也就是说,我们的理性只要能够满足环境以及社会的需要,就足够了。但现实生活的问题很多,仅靠一种思考方式是无法适应环境的,因此就需要针对不同问题,采用不同的启发式解决问题,这种像工人的工具箱一样,针对不同的问题采用不同启发式的思考模式,就叫做适应工具箱。
书中提及了很多种启发式,我在这里重点介绍其中的三种。
(1)再认启发式
再认启发式主要适用于仅有两个选项的选择场景。它的内容是:当你认得其中一个选项,但不能再认另外一个选项的时候,选择能再认的那个选项。
举个例子:以下两个国家那个人口更多?A)日本;B) 厄立特里亚。请读者朋友们选择一下。
按照再认启发式的原理,我只认得A,B选项完全没听说过,因此选择A。
事实也是如此。据百度百科,日本2013年的人口为1.26亿人;而厄立特里亚位于东非,2012年的人口数据也仅有609万人。
也许有朋友会认为:这不会是作者随便找了个不认识的地方来硬凑一个说法吧?但事实上,类似问题的科学研究已经显示了这种再认启发式的准确性。ABC针对”哪一个美国城市有更多居民:圣地亚哥或者是圣安东尼奥?“分别向芝加哥大学(美国学生)和慕尼黑大学(德国学生),结果显示,尽管美国学生的正确率仅有62%,而100%的德国学生都作出了正确的选择。这种选择的依据在事后发现,德国学生们都听说过圣地亚哥,但他们多数人都不知道圣安东尼奥,因此他们能够运用再认启发式,从而作出了正确的选择。
(2)采纳最佳启发式
那么,当选项均能再认,且线索和选项变得更多的时候,人们是如何根据这些繁杂且依旧不完善的线索和信号进行推断、预言和决策呢?
历史上一种理性的决策方式是道德决策代数学(moral algebra)——就是将一张纸折成两栏,一栏写正面影响;另一栏写负面影响,接下来对两栏的线索进行衡量,如果正面影响的m条理由抵得上另一栏的n条理由,就把它划去。直到最后留下的线索就是决策的关键因素。但在这种决策方法中,需要大量的时间、知识、计算能力,在复杂的人类选择情境下,这种方法是很难奏效的。因此,书中介绍了一种能在有限资源下进行迅速决策的方法:采纳最佳启发式。
采纳最佳启发式(take the best)的本质,就是“为一个好理由下赌注”。这种启发式将我们参与选择的线索进行权重上的排序。在决策时优先使用权重最大的线索进行判断,如果一个线索能够区分两个选项。就停止搜索,并选择线索支持的那个选项;否则就选择剩下线索中权重最高的线索接着判断。
比如说,《宠物小精灵》中的喷火龙和《数码宝贝》中的暴龙兽,谁更厉害?由于这两个角色一般看动漫的人都知道(即都能再认,应该没有人不知道喷火龙和暴龙兽吧= =),不能采用再认启发式进行判断。评价的标准有很多,这里不妨考虑6个比较明显的线索(参考了JOJO提升使者的评价标准):招式破坏力、速度、射程、持续战斗力、成长性、精密性。根据采纳最佳启发式的方法,需要对这些标准(线索)进行排序。根据启发式的观点,单独使用时作出正确归类的线索应当排在作出较少正确归类的线索之前。根据以前看动漫的经历,考虑到这是团队作战,不妨设想:成长性是最佳线索,其次是招式破坏力、速度、精密性、射程、持续战斗力。
那么首先对成长性进行判断,由于《宠物小精灵》中喷火龙与小智之间出现过摩擦,并不如《数码宝贝》中太一与亚古兽之间的友情那么持久。再加上数码宝贝和人类是能够直接交流的,比宠物小精灵的交流便捷得多,因此认为喷火龙的可成长性弱于能向人类直接交流学习的暴龙兽。因此停止搜索,选择暴龙兽。
至于结果,请看这个:【个人汉化】神奇宝贝VS数码宝贝【生死决斗DEATH BATTLE】
采纳最佳启发式为什么能起到这样的作用呢?书中提到了3个原因:(1)采纳最佳启发式的本质是一个拥有不可替代权重的线性模型。当一个线索拥有者不可替代的权重时,其计算结果事实上与综合考虑所有线索的结果是一样的;(2)采纳最佳启发式已经进行过最高权重的线索值间的比较;(3)采纳最佳启发式相当于一个简单分类树,根节点就是最高效度的线索,这保证了其科学性。
(3)排除归类法
排除归类法(categorization by elimination)主要用于多种线索多种选择的场合。它首先对线索进行权重上的排序,然后将所有线索分别对这些选择进行分类,获得数量等同于线索数的分类方式,最后对新的待分类物按照顺序分别使用分类方式进行匹配,并排除不再这些分类方式交集中的选项,直到最后只剩下一个选项。
这里偷懒地使用了书中的例子(P301),假设我们要对一种酒的类别进行判断,那我们首先需要在训练时,对甜味、色泽、芳香、有无酒精进行排序(就品酒来说,色泽>芳香>甜味>有无酒精),然后用着四个线索分别对已知的酒类进行划分,得到4种分类方法。最后用这种分类方法,分别从色泽、芳香、甜味、酒精进行匹配排除。直到剩下一个选项,或者所有线索用尽(此时需要在剩下的选项中随机猜测)。
3、简捷启发式的启示是什么
纵观书中提到的简捷启发式,一个有趣的共同点在于:书中提到的简捷启发式,其关键步骤都包括了对线索的权重排序。即使是再认启发式,也只是将“能否再认”这一线索的权重放到最大的采取最佳启发式。这也意味着,当我们能够掌握一两个效度最高的线索,就足以进行比较准确的决策了。
那么问题来了,我们如何知道这个线索是效度最高的呢?
对于这个问题,RAFT模型(reconstruction after feedback with the best,采用采纳最佳启发式的反馈后重建)可以提供这样一种解释的思路。RAFT模型描述的是事后通现象(一种人们事后自欺欺人地相信自己早已正确地预测了事件结果的倾向)的过程,这个模型认为,有关答案的反馈信息导致了线索值的更新,如果原始知识无法直接得到,则依据反馈的结果来更新自己判断的线索值。(见图)
事后通偏向的RAFT模型(P244)这个流程图的其中一个核心思想是,当人们不能回忆选项在某个线索的关系时,根据反馈的结果,推断出选项各个线索的关系,并应用采纳最佳启发式,只选取最重要的线索,作为今后的决策标准。
这也意味着,线索的效度需要来源于现实的不断实践与对反馈的回忆。我们的一些选择和判断肯定不会一直准确,而是会有出错的时候。这时,我们的总结与反思事实上是在将我们犯错的过程与事实进行不断对照,从而发现了通往正确选择的最重要的线索。这种过程和研究时的学习阶段一样,是需要通过大量类似的实践来不断调整的。当这种训练达到一定阶段的时候,我们的决策才会变得又快又准。
4、总结
简捷启发式,是在我们面对知识、时间存在限制的情况下保证决策理性与准确度的途径。本文认为,简捷启发式的本质,是对线索顺序的优化与选择,并从中选择最大权重若干个线索,作为决策的标准。而线索的权重,需要依靠现实的实践不断调整,在回忆与反思中调整线索甚至识别新的更重要的决策标准。
正如书中巴特莱特提到的“记忆不是无数固定不变的、毫无活力的不连贯痕迹的重新激活。它是富有想象力的建构或重新建构过程”(P233),成为一个理性的人未必需要像计算机一样,拥有海量的知识和运算能力(也不可能),但我们完全有可能通过实践中的反思与调整,得到更为简练而有效的知识结构。而这,也是作为高段位的学习者真正应该具备的。
网友评论