【学习分享】管理经济学(34)——囚徒困境
【课程】圈外商学院
囚徒困境说的是这么一个悲惨的故事。两个穷途末路的人决定去抢银行,可惜失败了,虽然他们没有当场被抓,但是所有的证据都指向他俩,所以他们以嫌疑犯的身份被抓去警局了,为了防止他们串供,警察把他们单独关起来,一个个审。
这是-一个非常典型的博弈,对俩人来说,他们就是这个博弈的局中人,招供还是不认罪是他们可选的策略,而他们的得失就是他们所受到的刑罚。
他们的得失情况是这样的,如果两个人都招供,各判5年;如果两个人都不认罪,则各判2年;如果只有一个人招供,那么招供的这个人将被判1年,不认罪的那个人要判10年。
我们可以看到,如果两人都选择不认罪,同时包庇对方,两人的量刑结果是最轻的,每个人只要判2年。
然而囚徒的内心却是复杂的:对小a来说,要分析两种情况,也就是小b招供和不认罪的两种可能。
第一种情况,小b不认罪。这个时候小a招供,会被判1年;小a不认罪,会被判2年。那相比之下对小囚徒来说,招供是更优的策略。
第二种情况,小b招供。这时候小a也招供,会被判5年;小不认罪,就要被判10年。相比之下,招供仍然是小a的最优方案。
不难发现,无论小b选择招供或者不认罪,小a的最优策略都是招供。
不用惊讶,你发现的就是囚徒困境的根源,无论小b怎么选,小a永远都会选择招供,招供就是小a的占优策略,占优策略就是无论竞争对手怎样,永远都会被选择的策略。
同时不认罪这一在任何情况下都不会被小a选择的策略就是劣势策略。
你再看下小b的占优策略和劣势策略分别是什么。没错,小也是无论小a怎么选都会有招供这一占优策略, 而不认罪也是他的劣势策略。
如果这两名囚徒都够理性,他们必然会双双选择招供,受到5年的刑法。
两人都选择招供的策略组就是这个博弈的纳什均衡。这不是给他们带来最优得失的策略组,但是却是唯一的均衡。
无论他们在被抓前怎样互相承诺,在面临这样的囚徒博弈时,招供是他们自主自发的唯一的选择。
网友评论