囚徒困境

作者: 盛况 | 来源:发表于2018-07-15 02:58 被阅读0次

博弈论-囚徒困境与重复囚徒困境的启示
棘手的重复囚徒困境下
囚徒困境｜教你避免背叛
《博弈论》系列一：囚徒困境与纳什均衡
背叛也是有价格的~
互害模式的囚徒困境和亚当·斯密的自利
博弈论开篇
听《角斗士、海盗与信任博弈论》笔记
社会心理学第十三章冲突与和解
今日得到20170711-互惠合作：离职员工的关系网

囚徒困境是博弈论中非零和博弈的代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中囚徒困境的例子屡见不鲜。

两个共谋犯罪的人被关入监狱，不能互相沟通情况。如果两个人都不揭发对方，则由于证据不确定，每个人都坐牢一年；若一人揭发，而另一人沉默，则揭发者因为立功而立即获释，沉默者因不合作而入狱十年；若互相揭发，则因证据确实，二者都判刑八年。由于囚徒无法信任对方，因此倾向于互相揭发，而不是同守沉默。最终导致纳什均衡仅落在非合作点上的博弈模型。

囚徒困境（prisoner's dilemma ）：两个被捕的囚徒之间的一种特殊博弈，说明为什么甚至在合作对双方都有利时，保持合作也是困难的。囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护、人际关系等方面，也会频繁出现类似情况。

人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚，或者损害集体的利益。

单次和多次的囚徒困境，结果不会一样。

在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为平衡的结果出现。欺骗的动机这时可能被惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。反复的、接近无限的重复次数时，纳什均衡趋向于帕累托最优，从互相背叛趋向于互相忠诚。

囚徒们虽然彼此合作，坚不吐实，可为全体带来最佳利益（无罪开释），但在对方的表现不明的情况下，因为出卖同伙可为自己带来利益（缩短刑期），也因为同伙把自己招出来可为他带来利益，因此彼此出卖虽违反最佳共同利益，反而是自己最大利益所在。但实际上，执法机构不可能设立如此情境来诱使所有囚徒招供，因为囚徒们必须考虑刑期以外之因素（出卖同伙会受到报复等），而无法完全以执法者所设立之利益（刑期）作为唯一考量的因素。

别人保持沉默，建立了互信的关系，你也会保持沉默，导致帕累托最优。