囚徒困境是博弈论中一个非常著名的例子。
“ 两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,抵赖的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,比起抵赖的判十年,坦白还是比抵赖的好。结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各判一年,显然这个结果好。”
单次和多次的囚徒困境,结果不会一样。
在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为平衡的结果出现。欺骗的动机这时可能被惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。反复的、接近无限的重复次数时,纳什均衡趋向于帕累托最优,从互相背叛趋向于互相忠诚。
我们开始做一些假设,来重新看这个问题。
如果这两个罪犯一个是宋高宗,一个是岳飞,猜猜他们会怎么选择?
宋高宗第一次就选择抵赖,岳飞坦白。
如果这两个罪犯一个是斯大林,一个是他的保镖,猜猜他们会怎么选择?
保镖第一次就选择坦白,斯大林抵赖。
如果这两个罪犯都是同一窝蜜蜂,一个是蜂王,一个是工蜂,猜猜他们会怎么选择?
当然蜜蜂不会被警察抓住,他们一般不犯警察感兴趣的罪行。不过在遇到任何攻击的时候,任何一只工蜂都会毫不犹豫地牺牲自己,保证蜂王的安全。而蜂王会毫不犹豫地逃生,以保证蜂群的持续生存。
囚徒困境之所以难,就是因为两个人如果选择是基于对自己的利益最大化,那么答案极不确定。
我刚刚举出的例子,都是设定了这两个罪犯归属于同一个整体,而这两个人对组织极其忠诚。而代表整体未来的那个人毫不犹豫地选择抵赖,另一个人坦白。
这就是整体的未来对人行为的影响力。
当然,原来的例子中就说了如果这是一个重复发生的事件,那么选择会慢慢趋近于最优选。
而所谓重复发生,就是两个人对整体未来有一个学习的过程。时间会教会在一起的一群人,学会怎么形成整体组织,来应对外界的威胁。整体的未来是所有组织成员的共同指向。只要整体的未来和自己的未来一致,成员就很容易为了组织牺牲自己的利益。
盗墓者,常常遇到一个人跳进坑里,另一个人要负责用绳子把拉他上来。此时出现的情况非常类似囚徒困境。因为跳坑者如果发现了宝贝,而上面的人起了贪心,就容易在上面把他砸死,然后独吞宝贝。而盗墓者发展出一个行业规则,就是父子搭档,儿子跳坑,老子拉绳。理由非常简单,儿子代表老子的未来,老子不会毁灭自己的未来。如果老子跳坑,儿子拉绳,儿子就不一定会那么忠心。
囚徒困境,本身是一个现在利益选择,加入“整体”和“未来”的概念,其实这个选择不那么难。难是难在对整体未来的信任。
网友评论