美文网首页
合作行为具有进化优势

合作行为具有进化优势

作者: whybask | 来源:发表于2019-10-19 23:48 被阅读0次

在亚里士多德世界观体系中,虽然众多的科学家知道地球是圆的,恒星、行星有各自周期性的运行轨道,但无法解释“物体为什么会下落”、“星星为什么按圆周运转”。对此,宗教解释道:这是上帝的安排。整个宇宙被看作是有“目的性的”。

雅拉神山与星空

在牛顿理论中,通过惯性定律和万有引力定律,行星运动轨道得到了一个自然解释,而不再需要用上帝、其他神明来解释。强调用自然来解释自然现象而不是用超自然事物或力量来解释,是现代科学的核心部分

但牛顿的理论仍解释不了“人”是怎么来的。宗教仍然占有高地,解释道:所有生命体都是上帝创造的,而且“人”生来就比其它动物更高等。

达尔文的进化论为最后一个以前看似需要用超自然因素来解释的现象提供了自然解释,也就是说,进化论为我们在生物界所发现的复杂性提供了一个自然解释。在一个科学得到充分发展并且尊重科学的世界观里,宗教关于上帝(或其它神明)的观点、以及关于宇宙有一个宏伟目标的观点,就已经没有了立足之地。

但直到这时,你以为宗教就彻底认输了吗?并非如此,除非科学没有疑点。

让达尔文困惑的是:合作行为,特别是利他主义行为,从进化角度来看似乎很有问题。举个例子:某青年见义勇为去救落水儿童。他是冒着牺牲大好未来的风险,为了一个在遗传上没有任何关系的人,而置身于一个可能没有任何回报的场景中。

这种利他主义行为一点也不少见,然而一个以“生命个体”成功生存和繁殖为目的的进化过程,怎么可以导致这样一个看来没有意义的行为趋势呢?从达尔文时代起,就一直存在关于合作和利他行为可能具有进化优势的多种推测。但推测挡不住宗教的游说:“利他主义”是上帝给人以道德。

阿克塞尔罗德在其1984年的著作《合作的进化》中阐述了诸如“以增加个人利益为目的的情境如何可以产生合作行为”的问题。

首先,我们来看一个经典的“囚徒困境”游戏:

假设A和B两个人有机会进行互动,而且这个互动将会是一次性的,两人中任何一人都不会与另一人再次进行互动。在这次互动中,每个人行为的目标都是追求自己的利益最大化,而且在不知道对方会如何行事的情况下,两个人都要针对在这次互动中是否要与对方合作做出决策。

行为与得分矩阵

如果A在不考虑B的情况下为追求自己的利益最大化而采取行动,那么A的推理将如下:我不知道B是否会与我合作。如果B与我合作,我也与他合作,我将得到10分,不与他合作,我将得到13分。13分比10分好,在这个情况下,我不合作得到的回报会更高。

另一方面,如果B不与我合作,但我与他合作,我将得到0分,不与他合作,我将得到3分。3分比0分好,在这个情况下,我不合作得到的回报会更高。所以,不管是哪种情况,也就是不管B是否与我合作,我不合作,都会得到更好的回报。

当然,B也会有同样的推理过程。结果就是,不管是A还是B,如果为了追求自己的利益最大化而不考虑对方都不会合作,最终会导致(A=3,B=3)的结果。这是一个很有趣的情境,其中的每个人,为追求个人利益最大化而理性行事,会使整个情境变成从共同利益角度来看最糟糕的结果

阿克塞尔罗德在“经典囚徒困境”基础上,设置了“重复囚徒困境”游戏。具体来说,每一次单独的互动中,回报都与前面的回报矩阵相同。然而,重复的徒困境情境中并不只有两个人(可能有上百人或上千人),其中每个人都会与情境中其他所有人发生多次互动,并且在每次互动的时候都会知道前一次互动的回报情况。

在重复的徒困境情境中,很难提前把最佳策略推导出来,因为情境存在太多未知因素,其中最值得注意的就是其他人会采用什么样的策略。

为了搞清什么样的策略可能是最佳策略,在20世纪70年代晚期,阿克塞尔罗德向世界各地的研究者征求了策略,输入电脑程序中,然后让这些策略程序在一个重复的囚徒困境比赛中彼此竞争。这些策略程序不受任何限制,可以任意简单或任意复杂。每个策略程序的唯一目标就是在与其他策略程序所进行的上百次互动中努力积累最高得分,最后的胜利者将是获得最高分的策略程序。

策略程序竞争的结果颇为出人意料。很多人认为结果会符合谚语“人善被人欺”的描述,也就是“友好的”合作策略程序得到的结果将比不上那些不诚实、不合作的策略程序。然而,恰恰相反,其中最简单的且采取合作策略的一个程序最终在比赛中获得了胜利。更有趣的是,几个月以后,同一个策略程序又在相同的比赛中获胜,而且这次参赛的策略程序范围更广,数量更多。在两次比赛中,大多数人都知道这个策略会参与到比赛中来,因此可以专门针对这个策略来进行程序设计。

赢得了这两次比赛的是一个名叫“以牙还牙”( Tit for Tat,TfT)的程序。TfT与其他某个程序第一次互动时,都会选择合作,绝不会成为第一个与其他某个程序不合作的程序。然而,TfF会报复,如果某个程序没能与TfT合作,那么下一次与这个程序互动时,TfT就不会再合作了。

TfT的整个策略总结起来很简单:TfT在与其他某个程序第一次互动时都会合作,在之后的互动中,TfT都会按照对方程序在上一次互动中的策略来行事

不仅是TfT,其他采取合作策略的“好人”程序,通常所得结果也都压倒性地胜过“非好人”程序。比如,阿克塞尔罗德进行的第二次比赛中包括60多个输入了不同策略的程序,其中有些是“好人”,有些是“非好人”。比赛结束后,前15名(也就是整体得分最高的15个程序)中,有14个都是“好人”程序。

这些研究另一个有趣而具有普遍意义的结论与原谅的概念有关。在分析单个程序的互动时,很明显,有些程序陷入了报复的循环中。一个有助于打破这种循环的策略是在程序中加入某种“原谅”政策。阿克塞尔罗德最初的及自那以后所进行的研究,生成了很好的经验数据,有力地表明了,合作行为是一个在进化上具有优势的行为模式

从天文学、万有引力、进化论,到行为心理学,宗教的说服力越来越小,但还有很多未解之谜需要科学探索。

相关文章

网友评论

      本文标题:合作行为具有进化优势

      本文链接:https://www.haomeiwen.com/subject/qqhomctx.html