从基因的角度看世界,从基因的角度看看基因采取什么样的策略是能够在长期的博弈中能生存和持续下去的呢?结论是好人有好报,这点还是令人欣慰的。
先来讲一下博弈中比较典型的囚徒博弈,囚徒博弈是两个囚徒A和B,A和B被单独审讯,得分代表一定的刑期,如果A和B都选择背叛,那么各得1分,一个合作一个背叛,背叛者得5分,两个都合作得3分,在这种情况下,单次博弈毫无疑问最优策略就是选择背叛。但是,如果博弈不是一次,而是不停地做囚徒博弈呢?我们现实生活中,很多囚徒博弈,包括企业之间的合作与竞争,人与人之间的合作与竞争,甚至动物,当然这里也包括基因,都不是单次博弈,而是会有多次博弈存在。也就是大多数情况都是重复博弈的囚徒困境。阿克塞尔罗德办了一次有趣的活动,让博弈论的专家提交策略,用计算机语言编程来加入博弈,阿克塞尔罗德收到了14个策略,加上一个“随机”策略,一共15个策略,这15个策略与包含他自身在内的各个策略进行重复博弈,一共有225种组合,所有输赢累积计算,以得出最终的赢家。最终累积得分最高的策略胜出。经过多次角逐,最终获胜的一个策略,叫“针锋相对策略”。针锋相对策略是个很简单的策略,就是一开始打出的合作,而后每一步都根据对手的做法来,也就是说对手如果打合作,该策略就选择合作,对手如果打背叛,该策略就选择背叛。“老实人探测器策略”还有“愧疚探测器策略等”的平均分都低于“针锋相对策略”。15个策略中有8个是“善良”类的策略,所谓善良类就是不率先采取背叛的行为的策略。活动得出惊人的结果,15个策略中的8个善良类策略得分都排在前8名。令人高兴的是,好人在这个博弈中可以胜出。当然阿克塞尔罗德还进行第二次活动,引入了更多的策略,得到的结论大同小异。
除了善良之外,宽容是另外一个重要词汇,一个宽容的策略只有短期记忆,像针锋相对策略是短期记忆,当对手背叛后,又选择了合作时,该策略也会选择合作,即“过去的让他过去”。“斤斤计较”策略就是一个善良但不宽容的策略,一开始选择善良,但一旦对手选择背叛,该策略就会一直选择背叛。但是一个善良但不宽容的策略在善良策略中排名非常靠后。虽然看似一个乌托邦式的结论,但善良和宽容确实就会得到好报。
回到基因的角度,进化稳定策略ESS是基因选择的进化策略,也就是这个策略能够使同类复制得到特别好的结果。阿克塞尔罗德又做了一次活动,继续把策略丢给计算机程序,来制造进化演替的第一代,但是这一次大环境由这64种策略构成,赢家不再得到金钱或是分数,而是与其完全相同的后代。一些策略逐渐变得稀少,经过1000代之后,种群不再变化,大多数策略在200代后灭绝,很明显,善意策略始终赢得头筹,当所有恶意策略都灭绝以后,善意策略变得边界不再明显,到最后就是坚持与对手合作到底的结局。针锋相对策略,虽然不是严格意义上的进化稳定稳定策略ESS,但将这类善良又宽容的策略看做是ESS也是可以的。
好了,写到这里,在自私的基因的传说中,还是看到了好人有好报,看到了善良与宽容是进化稳定策略。感觉有些欣慰。
这也让我想到另外一个观点,如果人与人之间都只见一次面,很多人都会选择背叛而不是合作(比如说像好多地方发生的宰客行为,外地人去旅游,宰到一次算一次,因为这些人大部分以后都不会来了);所以为什么在熟人圈里,大家抬头不见低头见的,很多事情就要讲信用了,你如果不讲信用,选择背叛,重复博弈会让你尝到苦果。
网友评论