‘
![](https://img.haomeiwen.com/i3829058/a0eceb46d1ae6e2d.jpg)
【基本介绍】
《隐藏的博弈》,作者【美】摩西·霍夫曼、【以】埃雷兹·约耶里,任烨翻译,中信出版集团2023年8月出版,18.2万字。
传统经济学研究基于这样的假设:人是理性的。但正如行为经济学所表明的那样,人类的很多行为其实是非理性的。博弈论在现实世界的可信度,也因此让人生疑。在《隐藏的博弈》这本书中,来自美国麻省理工学院的两位研究科学家在古典经济学的超理性和行为经济学的非理性之间找到了一个不可思议的中间地带,他们称之为"隐藏的博弈"。
从我们说话时为什么会拐弯抹角,到斯德哥尔摩综合征的发生,以及我们为什么会愿意帮助陌生人,两位作者利用博弈论,揭示了几乎人类所有非理性喜好、信念和行为背后的深层逻辑,让人大开眼界。
【阅读感受】
全书共有15章,在阅读过程中,我产生了三段截然不同的阅读感受。
第1-4章,第一段,兴趣满满。这4章可以看成是本书的前引,主要讲的是博弈论的基础理论和概念,包括引言、学习、3组实用的概念辨析、博弈论的金标准。从一开始,作者就抛出了很多问题,比如热情是怎么发挥作用的,我们的是非观从何而来,人们为什么会表现出利他性等,这些问题就像个“钩子”,钩出了我的求知欲。
第5-10章,第二段,解题之趣。从第五章开始,作者运用博弈论来理解人类行为中令人困惑的地方。在这一部分,作者分别讲了鹰鸽博弈与权利、高成本信号与美学、隐藏的信号与谦虚、证据博弈与粉饰、动机性推理、重复囚徒的困境与利他性,我跟随着作者,体会到了一种解题之趣。对我来说,题有点难,好在还跟得上,还理解得了,从中还可以感受到一种学习之乐。
第11-15章,第三段,开始懵圈。规范执行、类别规范、高层级信念、子博弈完美均衡与正义、初级奖赏的隐藏作用,我是越翻越气馁,看得似是而非、云里雾里的,终于弃读。
【阅读所得】
1.
“假定人的表现是最优的”这一核心假设不成立,博弈论还可信吗?
已经有两位研究者因为有力推翻了这个假设而获得了诺贝尔经济学奖,他们分别是丹尼尔·卡尼曼(2002年),理查德·塞勒(2017年)。事实上,我们并不完全是理性的,也做不到掌握所有相关的信息,然后像计算机一样通过复杂的计算来使利益最大化。
不过有句话作者说得很有道理:“判断一种基于博弈论的解释是否正确、证明一种博弈论模型的最佳方法,就是打破它的假设,看看会发生什么。”
2.
为什么作者要从学习讲起?因为这是本书的分析前提之一。无论是通过强化从自己的经验中学习,还是通过模仿和指导向他人学习,都会引导我们去做对自己有益的事情,至少在大多数时候是这样的。
更有意思的是下面这个问题:为什么学习要塑造的是看法和喜好,而不是直接塑造期望的行为呢?
因为我们采用的更多是社会学习的方式,而不仅仅是强化学习的方式。强化学习的核心本质很简单:当一种行为会带来奖励时,它就会得到强化,并且更有可能重复出现。而社会学习的方式,比如因纽特人建冰屋、中南美洲用碱化湿磨法处理玉米,社会学习的方式说明了另一个问题:我们常常完全不知道自己为什么要做某件事,也不清楚学习所发挥的作用。
社会学习有两种效应:一是滞后效应。比如说某种饮食习惯尽管起源于一种需要防范食源性疾病的文化,但即便现在生活在一种没有这种需要的文化中,人们也坚持了这样的喜好。二是溢出效应。比如一种看法或喜好虽然在某个环境中仍然有现实用途,但在脱离这个环境后还继续存在。
正是因为有这两种效应存在,我们在学习中是去塑造看法和喜好,而不直接塑造期望的行为。从长期主义的角度甚至从进化的角度来看,这是一种能让我们行动起来的有效途径。还是以饮食习惯的养成为例,黑胡椒等香料可以抑制和杀死会导致食物变质的细菌。印度母亲逐步训练自己的宝宝忍受然后爱上辛辣的食物,这样就确保了他们的后代在不了解功能性行为作用的时候也会采取这种行为,一旦喜欢上了食物中加入黑胡椒等香料,他们就不会想着省略它,即使他们不知道吃它有什么作用。
3.
作者说,“我们使用博弈论给出的解释将全部都是聚焦初级奖赏的终极解释和客位解释”。短短的一句话中包含了三个方面的内涵:
一是聚焦初级奖赏,而不是次级奖赏。比如,如在教动物学习的过程中,食物是一种初级奖赏;声音指令、按摩肚子和哨声就属于次级奖赏。
二是聚焦终级解释,而不是近端解释。比如,生物学家通常不会止步于“雌孔雀认为长尾巴更有吸引力”这样的近端解释;他们会很自然地再深挖一点儿,试图找到一个功能性解释(终极解释)。事实上,每当问为什么的时候,我们都能给出很多答案。我们给出的答案取决于我们想要了解的东西,
三是聚焦客位解释,而不是主位解释。主位解释是指那些深受某种文化熏陶的人给出的解释,而客位解释是指客观的观察者给出的解释。
4.
在本书中,作者在分析每种博弈时,都会寻找这个博弈过程的纳什均衡。
纳什均衡是博弈论中最重要的概念。在纳什均衡中,每个参与者都会以其他参与者的行为为前提,尽力做到最好。
如果有参与者能通过偏离自己目前的策略而获益,而其他人不改变策略,那就不是纳什均衡。如果没有参与者能通过(单方面地)改变策略获益,我们就达到了纳什均衡。
5.
鹰鸽博弈代表了对某种资源争夺。只要一方被预期做鹰派,而另一方做鸽派,就没有参与者能从改变策略中获益。每个参与者如何选择并不重要,这种预期背后是否有充分的理由也不重要。重要的是,这是所有参与者都希望出现的情况。预期,不管多么不公平或者缺乏正当理由,都是会自行实现的。
在动物争夺领地的争端中,解决的原则是“主人胜,入侵者退”。同样,人类也用“我先来的”确定所有权。“现实占有,败一胜九”,也就是说,所有权往往默认属于那些占有物品的人。比如,在罗马法律中,只要无法证明一个东西是被偷窃或者通过不正当手段获得的,占有这个东西的人就有所有权。
鹰鸽模型的主要特点就是共同预期的重要性,这种预期一旦确立,就会自行实现。这个特点不仅体现在对一个球、一张钞票和一个戒指的权利上,也存在于更抽象的权利中,比如言论自由、性别和种族平等。
在鹰鸽模型中,参与者在斗争中获胜的可能性是均等的。但在涉及种族主义、性别歧视和绑架事件时,就出现了真正的能力不对称。但这个模型仍然告诉我们,我们的权利意识和价值感会判断攻击性行为是否为最佳选择。内化的种族主义以及性别歧视,并不是以自行实现的方式出现的。它们和斯德哥尔摩综合征一样,一开始看起来可能出人意料,但这些对暴力、虐待和歧视的反应或许是那些被绑架、被歧视和被虐待的人最好的选择。正如某位绑架案受害者在谈到斯德哥尔摩综合征时说的那样:“这不是一种综合征,而是一种生存策略。”
6.
为什么高端的雇主喜欢雇用有名牌大学学位的人,即使后者在这些学校里学习的很多东西对工作其实没什么帮助?斯宾塞给出了答案:这些学位帮助人们展现了很多有用但是很难被发现的事情,比如他们的智力、专注力、社交能力和家庭关系等。
学历、香料、长指甲、白皮肤、艺术品、礼仪、葡萄酒鉴赏力、烦琐教规……这些都是或者说曾经是高成本信号。
高成本信号博弈是由迈克尔·斯宾塞和阿姆农·扎哈维两个人同时分别提出的,其目的就是回答奢侈品这类问题。
这个博弈最重要的纳什均衡是这样的:当且仅当发送者是高级时,它才会发出高成本信号;而当且仅当发送者发出信号时,接收者才会接受它。
经济学家认为,这种纳什均衡是一种分离均衡,因为其中高级和低级发送者的表现不同,接收者仅仅通过发送者选择的行为就能将二者区分开来。比如,健康的雄孔雀只需要展示出它的尾巴,雌孔雀就知道它的类型了。
谦虚、匿名赠予、不露声色、欲擒故纵,这些行为有一个共同点,那就是它们都需要把一些好的东西隐藏起来,而不是到屋顶上大声喊出来。这似乎与我们根据高成本信号模型得出的结论完全相反。
事实上,隐藏本身就是一种高成本信号。它表示你能承担得起有人看不到你的一些理想信号的后果。就算这个信号没有被人注意到,发送信号的人也不会特别在意。
7.
“证据博弈与粉饰”这一章,关注的是发送者在试图说服别人时会如何粉饰证据。
人们粉饰证据有三种方式:倾向性披露、倾向性搜索和验证性试验。
在披露博弈模型中,我们假设如果证据存在,发送者就自然会看到。有利披露策略是这个博弈模型唯一的均衡状态;也就是说,在均衡状态下,当且仅当证据有利时,发送者才会披露证据。
在搜索博弈模型中,关键假设是:接收者看不到发送者花费了多少精力去搜索证据。这个模型唯一的均衡状态就是在搜索成本不太高的条件下,发送者采取有利搜索策略。
在试验博弈模型中,我们要研究发送者可以决定做什么试验,进而得出什么样证据的情况。发送者可以冒险掩盖信息,但不可能成功地伪造信息。接收者会根据发送者的行为进行调整。在没有充分了解发送者能力和动机的情况下,他们可能不会根据发送者的倾向性行为做出全面的调整。
在这三个博弈模型中,想要告知接收者和想要说服接收者的发送者表现得截然不同。当发送者想要说服而不是告知接收者的时候,倾向性披露、倾向性搜索和验证性试验就会出现,所以这些行为可以在我们不确定的情况下帮助我们弄清楚发送者的动机。
8.
一直觉得囚徒困境很绕,或许说博弈本就很绕,因为博弈的关键特征就是参与者的收益不仅取决于他们自己的策略,还取决于对方会怎么做。
单次的囚徒困境比较好理解。虽然双方合作对所有人来说都更好,但背叛才是优势策略——不管对方怎么做,每位玩家始终选择背叛都是更好的结果。这就让双方背叛成了唯一的均衡状态。
重复的囚徒困境就很绕了。我只记住了一句话,“以牙还牙策略是一种纳什均衡,但不是子博弈完美均衡”。
在重复的囚徒困境中,要想维持合作,有几点必须予以关注:一是”重复互动”的可能性必须高,过去的行为也必须是完全“能看得见的”。二是现在的合作必须在未来产生一些收益,比如之后别人更有可能与你合作(互惠)。因此,合作行为需要有条件:人们不可能只是不加选择地合作,就像他们可能与亲属合作,或者他们有直接的动机去提高别人的收益。三是要保持敏感度。因为有很多种均衡状态,特别是总有一种参与者始终选择背叛的均衡状态,所以对预期、环境和框架等任何影响预计合作能否带来回报的因素,都要很敏感。
就记这些吧,也算是读过了。
网友评论