(全文字数:2475字,阅读完大约需要8分钟)
哥哥姐姐弟弟妹妹们,大家好,我是王同学。
这两天学习了博弈论的著名案例——囚徒困境,下面分享一下自己的学习心得。
开始之前想让大家思考一个问题,一个小偷偷了50块钱,被偷钱的人选择了报案,警察经过计算之后,发现抓这个小偷大概需要1000元的成本,请问这个时候更好的选择应该是直接给报案人50元,还是选择花1000元的成本去追回这50元?
这个问题其实就是囚徒困境的一个具体应用,要想知道答案,我们就先要知道囚徒困境是什么。
01 | 什么是囚徒困境
两个小偷作案,被警察抓获,分别被警察带到不同的审讯室进行审讯,他们彼此不知道对方是否会招供。警察明确告诉他们,如果他们当中谁先招供而另一个人没有招供的话,招供的人可以免于处罚,而不招供的人则会被判处五年有期徒刑。如果他们两个都招供,两个人都被判罪,每人会被判三年有期徒刑,两人都不招供,每人判一年有期徒刑。
于是,两名囚徒就有了四种情况,
囚徒A招供,囚徒B不招供,A判0年,B判5年;
出来以后,B一定会报复A。
囚徒A不招供,囚徒B招供,A判5年,B判0年;
出来以后,A一定会报复B。
囚徒A招供,囚徒B招供,A判3年,B判3年;
再见面,双方都很尴尬。
囚徒A不招供,囚徒B不招供,A判1年,B判1年;
真兄弟,患难见真情。
对于囚徒A而言,如果囚徒B不招供,自己应该招供,因为这样自己会被无罪释放,否则自己会和对方一起被判一年。如果囚徒B招供,则自己也应该招供,这样两个人一起被判三年,否则自己会被判五年,而对方无罪释放。可见对于囚徒A而言,不管另一个囚徒招供还是不招供,招供对自己都是最有利的选择。
所以,在囚徒困境当中,同时选择招供是两名囚徒的纳什均衡点,这是根据每个人的个人最优解推导出来的。但是很显然,在这个案例当中,集体的最优解是同时不招供,这样每个人只需要被判一年。这种纳什均衡点和集体最优解偏离的情况被称为囚徒困境。
02 | 如何导致囚徒困境
简单来说,这是由于人性的趋利避害本能以及规则制定导致的。
人总是想让自己的收益最大,损失最小,而制规则制定可以充分利用人性趋利避害的这一点达到自己的目的。
03 | 现实生活中的更多案例
以上的囚徒困境只是一个很简单的两个人例子,在现实生活中,由于参与的个体很多,我们的情况更加复杂,而且还有一点很重要,人越多,就越难达成共识,纳什均衡的威力就越大。
比如说,商业竞争当中的价格战,国家与国家之间的军备竞赛,应试教育中学生与学生之间的分数排名,公共资源浪费,交通堵塞,团队当中的加班文化或者偷懒文化。
5740c422bc752c3df41900b6fd4c35d3.jpeg
相比于多人参与的囚徒困境,更难的囚徒困境则在于多层囚徒困境的相互嵌套,一个小的囚徒困境嵌套在一个大的囚徒困境里面,大的囚徒困境又嵌套在一个更大的囚徒困境里面,这样就非常难解。具体的例子大家可以想一想底层,中层,上层之间的生存资源分配问题,我们这里不多嘴,总之不管身处哪一层,所有人都是囚徒。
04 | 如何破解囚徒困境
要破解囚徒困境,关键是要形成共谋,让两个囚徒相互信任,如何建立这种信任就是最重要的。
比如对不合作的人进行惩罚(比如,出狱之后砍掉他一只手),对不合作的行为形成报复能力(比如,监狱外边还有第三方惩罚势力),增加人质(比如,拿他的家人要挟他),建立信任(比如,长期进行合作,彼此知根知底),建立忠诚的文化(比如,黑道拜关公,讲究一个义字),建立长期的关系,让双方的关系成为多次博弈,而非一锤子买卖(比如,出狱以后没办法继续在道上混)。
以上的办法仅针对于两个人或多个人的囚徒困境,如果是多层嵌套的囚徒困境,需要先解决上一层的囚徒困境,下一层的囚徒困境才有可能被解决,否则都是徒劳。
05 | 如何应用囚徒困境
对于规则制定者而言,规则制定的目的是要让个体最优解导致的纳什均衡点和集体最优解相重合,让所有的参与者避开短期有利但长期会受处罚的选择。让整个社会避开无效的纳什均衡点,最终让每个人基于自身利益所作出的决策,可以共同推动社会的快速发展。
对于游戏参与者而言,有一句话说的很好,一名优秀的棋手,不仅清楚棋盘上每一枚棋子的作用,也应该知道自己是一个更大棋局的一枚棋子。
首先,识别自己处于哪一层的囚徒困境,再者,要了解清楚这是一个多次博弈还是一次博弈,如果是多次博弈,这一次的结果会影响到我们以后能否继续参与博弈,如果是一次博弈,一次结束之后就不会有以后,那么就需要在这一次博弈当中为自己获取最大的利益。由此可见,诚信或者谦让本质上是一种选择,是为了多次博弈而准备的。
还有一点,对于囚徒困境当中的参与者,做出决策一定要先于对方才会获得超额收益,比如说,
别人开车不加塞,我们加塞,这样我们就可以更快到达目的地;
别人家的商品不降价,我们家的降价,这样我们产品就可以更快地卖出去;
别人家的孩子周末不学习,我家的孩子周末学习,这样我家孩子的成绩就会变好;
别人家的软件需要付费,我们家的软件免费使用,这样我们的使用人数就会快速提高;
总之,谁先放低底线参与竞争,谁就会获得更多的超额收益,而后加入的人只能获得平均收益,这也在一定程度上解释了为什么所有的商品,最终的销售价格都会趋近于产品的成本,最多只能获得社会平均收益。
有的人认为这样不好,率先这样做的人是害群之马,王同学倒不这样认为,谁先找出漏洞,谁先开启新的竞争,正是这个人改变了当前的规则,这是在用一种信号提示规则的制定者,如果当前不符合规则制定者的意图,规则制定者需要优化自己的规则,而不是把找出漏洞的这个人给优化掉。
52fd8821501962419df7030f7034e887.jpeg
最后,我们来回答一下开始的那个问题,聪明的读者应该已经有了自己的答案,答案应该是警察花1000块钱成本去抓回那个小偷,这件事情本质上不是经济账,而是在于给社会群体制定了规则——执法必严,违法必究,不管偷了多少钱,都是要受到惩罚,否则会让更多的人去专门偷盗1000块钱以下的金额,明确的惩罚规则可以让整个群体的纳什均衡点和社会利益最大化的点相重合。
一点学习心得,分享给大家,国庆节快乐!
自知,重基础,专心致志
王同学
2023.10.1
网友评论