1. 绪言
如果你正独自开车送别人的1千万美金去某地点,酬劳是1千美金,你内心里会不会想从此人间蒸发,然后在某个无人知道的太平洋小岛享受你的一千万美金?
就算有人有这种想法,但不一定会不这么做,因为需要去考虑很多其它因素,这些因素是什么呢?
那在合作还是背叛的选择上,对个体而言,有没有最好的策略可以遵守呢?
美国科学院院士,著名的行为分析及博弈专家,罗伯特·阿克塞尔罗德在它的《合作的进化》一书中详细论述了合作关系产生的条件,并且通过试验,验证了一种合作关系中成功的策略,或许能帮我们回答这个问题。
基于本书理论可能给人们带来的美好的结果,有人甚至认为《合作的进化》值得取代圣经。
2.合作的进化
2.1 合作的重要性
首先来说说合作。
我们渴望合作,合作能带给我们对立情况下所不能获得的好处和利益。
在现实世界中,合作关系到处可见,和我们每个人的生活息息相关:
个人层面,你会继续帮助你的一位从来不思回报的朋友吗?
公司层面,一个公司会给另外一个濒临破产的公司及时的支持吗?
国家层面,一个国家如果面对另一个国家的敌意行为?
比如:1979年,苏联入侵阿富汗,就给美国出了个难题。不予反应,苏联就可能受到鼓励而尝试其他形式的不合作。美国不合作的反应,又可能引起苏联的报复,接着又会引起美国的反报复,进而发展成难以终止的双方敌对局面。这些确实是困难的选择。
但关于合作,我们却了解的不多。合作是如何建立起来的?怎么维护好一个合作关系?什么可以做,什么不可以做?
这些问题的解决与否,极大的影响了我们在与他人交往时的思维和行为,进而也影响到我们的生活。
2.3 研究目标
人类的合作关系中存在一个根本性的问题:个体对自身利益的追求可能会损害整体的利益。
例如:国家间的贸易壁垒的设置问题,如果双方能消除壁垒,两个国家都能受益,但无论谁单方面消除壁垒,都将处于不利地位。
作者就是期望通过研究“在每一个人都有自私动机的情况下,怎么才能产生合作关系?”,来建立一种合作的理论,帮助我们理解合作出现需要的条件,以及如何去采取适当的行动去培育这些条件,促进合作的出现,实现某种程度的共赢。
2.2 研究手段- “囚徒困境”游戏
作者的研究对象就是“重复囚徒困境”游戏,期望通过研究游戏中策略的使用和出现的结果,来获得某些结论。
为什么选择“重复囚徒困境”游戏作为研究对象呢?
先来说说“囚徒困境”的最基本形式:
游戏中,有两个对策者,他们可以选择背叛和合作,而且必须在不知道对方的选择下,做出自己的选择。
如果双方都选择合作,将各得到3分;
如果双方都选择背叛,将各得到1分;
如果一方选择背叛,一方选择合作,选择背叛方得到5分,选择合作方得到0分。
双方知道合作会比背叛得分高,但是根据推理,却只能选择背叛,这就是困境。
而且,双方的交流只能通过他们的一系列行为来进行。
“囚徒困境”游戏作为研究对象的优势:
和国际象棋之类的你死我活的零和博弈游戏有很大的不同,“囚徒困境”游戏是非零和游戏,游戏双方没有严重的利益冲突,允许双方从合作中得到好处,同时也提供了不合作的可能,甚至一方占另一方便宜的可能。
“囚徒困境”是对一些非常普遍而有趣的情形的简单抽象,普遍的出现在个人关系和国际关系的关系中,和大多数现实情况中的人际关系一样。
“重复囚徒困境”能模拟出对策者的品质特征、对策者之间的关系等各种因素,又摈弃了很多无关紧要的阻碍研究的细节,使一些微妙的规律更容易被发现;所以这个游戏已经变成了一个探讨社会心理学中各种问题的标准的方式,是一种标准的试验手段。
事实上,许多重要的政治、社会和经济过程的最好的模型都是以“囚徒困境”为基础的。
2.3 研究过程
作者整个研究活动,采用了以下这些过程,并从这些过程中得到了研究结论:
过程1:进行单次“囚徒困境”游戏
如果你认为对方会背叛,你选择背叛得到1分,和对方一样多,比选择合作得到0分要多;
如果你认为对方会合作,你仍然选择背叛可以得到5分,比选择合作得到的3分要多。
而你选择合作,却要承担对方选择背叛,你得到0分的风险,所以,双方基于这样的考虑,肯定会选择背叛。
这个情况下,合作不会产生。
过程2:多局“囚徒困境”游戏,但总局数确定
如果总局数确定,那最后一局,就是单次“囚徒困境”,肯定大家都会背叛;
如果最后一局结果已知,倒数第二局就变成了单次“囚徒困境”,大家仍然会选择背叛;
依次类推,双方将永远选择背叛,合作不会产生。
过程3:多局“囚徒困境”游戏,但总局数不确定
但当总局数不确定时,就是“重复囚徒困境”游戏,这个时候双方不知道什么时候结束,双方为了得到更好的结果,双方就会开始去寻找出现合作的条件,进而形成合作。
通过对过程1,过程2,过程3的观察和分析,作者得出一个结论:
未来仍然会相遇且相互作用,是对策者产生合作的必要条件。
但却不是充分条件,即使未来相遇,但对策者做出什么选择仍然不确定。
那“重复囚徒困境”下,各种策略在大概率相遇的情况下,会出现怎样的行为模式?会有策略是最优的吗?
过程4:作者邀请对策专家提交代表自己策略的计算机程序参加“多重囚徒困境”竞赛,保证了竞赛的质量的同时,把缓慢的相互作用进程进行了加速。
作者试图根据竞赛过程和结果的信息,找到能很好处理囚徒困境的策略。
竞赛是循环进行的,每一个程序将和其它所有程序相遇,也和自己相遇,还要和一个随机决定合作还是背叛的程序相遇,最终哪个策略的得分最高即为胜出。
一共进行了两轮竞赛:
第一轮竞赛:有14位来自经济学,心理学,社会学,政治学和数学领域的专家提交了参赛程序。循环了5次,一共是12万次对局,24万个不同的选择。
第二轮竞赛:在了解了第一轮竞赛的结果即分析后,有来自6个国家的62个程序,参与了第二轮竞赛。
一个“一报还一报”策略,程序是最简单,结果却是最好的。在和各种策略的竞赛中胜出,这些策略包括:从不合作的策略、试图占便宜的策略、先合作然后绝不宽恕的策略和总是宽恕的策略等。
“一报还一报”策略是什么样的策略?这个策略以合作开始,随后只模仿对方上一步选择的策略。
就是第一步选择合作,如果第一步对方合作,我第二步也合作,如果第一步对方背叛,我第二步也背叛,第三步又根据第二步对手的决定来决定。它只有一步记忆。
过程5:为了验证一报还一报的普遍适用性,又进行了6种改变了规则的竞赛
“一报还一报”在5个竞赛中取得第一名的成绩,一个竞赛中取得第二名的成绩。
过程6:将生物进化论的观点引入“重复囚徒困境”进行试验,看策略的进化过程
基本假设是,生物界不适合生存的生物,将从数量上逐渐减少,直到灭绝;
在“重复囚徒困境”竞赛中,可以模拟自然的进化,按照每个策略的得分占总得分的比值,来动态确定每个具体策略程序参与竞赛的拷贝数,成功的策略,分值占比高,参与竞赛的拷贝份数就多,反之,拷贝就减少,甚至淘汰。
当唯一一个在前15名中不善良,占便宜的策略,初始表现也很好,但在表现不好的宽容的冤大头策略都优胜劣汰后,这个策略也迅速被淘汰了,就是它摧毁了它自己成功的根基,哪些可以被它占便宜的策略存在了,它占不到便宜了,这个策略的从繁荣到淘汰,很好的说明了这个进化过程。
“一报还一报”在进化过程中,又一次胜出,成为最成功的策略。
试验结果表明,一报还一报策略是有很好的适应性和健壮性的策略,在大多数的环境中表现极佳。
“一报还一报”策略的胜出,是偶然吗还是另有原因?
显然不是偶然,作者总结出了“一报还一报”的获胜的原因来自它的规则的特性:
1)善良性,即从不首先背叛。因为善良的策略相遇时,能合作的很好,大幅提高得分,比赛中善良的策略还不少。由于它放弃了占人便宜的可能性,虽然有时候会被占便宜,但试图占人便宜的策略,极大可能会带来其它策略的报复,有些策略的报复是无法解脱的。一报还一报的善良性,避免了很多不必要的冲突。
雕爷就在这条上犯过错误,他的一本书中提到,在一个员工欺骗了他之后,他开始对所有员工都怀疑,心态很不好。当然后来他意识到这个问题,调整到善良的状态,重新开始信任没有欺骗过自己的员工了。
2)宽容性,即在对方背叛之后的合作倾向。一报还一报对于背叛,只不宽容一步,之后就完全原谅。而宽容性最小的策略,永久报复策略,在竞赛中得分最少;不善良的策略表现不佳,就是因为多数策略都不是很宽容,这样不利于合作的重新建立。一报还一报策略挽救了很多合作的机会,从对立中重新恢复了合作。
3)报复性,即如何迅速的,可靠的对来自对方做出报复的反应。除非一个策略能迅速对对方的挑战做出反应,否则,对方将简单的从好说话的策略身上获得越来越多的好处。一报还一报是马上激怒并报复的,这样使对方背叛一次之后不敢再背叛。
4)清晰性,行为要简单清晰,使对方能快速理解并适应你的模式。如果想和“一报还一报”策略很好相处,就只有和它合作,即使有占便宜的策略来尝试占便宜,也马上发现了这个问题,转而合作。一报还一报的清晰性让它容易被理解,从而引出长期的合作。
通过对过程4,过程5的分析,作者得出一个结论:
由于一报还一报策略的胜出,基于回报的合作理论是可行的。
虽然基于回报的合作理论是可行的,但在现实生活中,合作的初始存活是如何发生的?存活之后,是否能稳定的发展并且不容易被破坏呢?
初始存活问题:
通过上面的竞赛过程和结果分析,善良策略在和不善良的策略相遇时,没有得到高的平均分,善良策略能胜出的原因,是善良策略之间合作的很好。
单个采用合作策略的个体,或少量这样的个体,但是难以相遇,只是散乱的去努力,在不善良的策略中,不能存活,合作是不能建立的。因为在周围都是不善良的策略环境中,善良的策略由于第一步被占便宜表现不及不善良的策略,而不能生存。
但是如果基于某种原因,比如由于血缘关系,出现一个哪怕很小群体,只要这个群体内的成员接触的足够久,它们所采用的合作的策略就将使他们脱颖而出,合作就是可以存活并建立起来的。其它策略看到他们的优势,也会从背叛转变成合作。
这样,一小群人能互相遇到并采用合作策略,就能让合作关系在诞生并开始发展。
稳定发展及防止破坏:
如果未来足够重要,也就是在未来双方可以实施回报或惩罚,那善良策略建立起的合作关系是稳定的,否则,就不是稳定的。如果一方虚弱,不能活太久,对方更可能背叛,捞一票走人,从而破坏合作关系。这就是“逆境中一个人的朋友也会变成敌人”。
在未来足够重要的前提下,一报还一报的策略是稳定的,其它非善良策略,是没有胜出的机会的,非善良策略会遭受到来自善良策略的报复,如果相互作用的时间足够,非善良策略的背叛得到的收益将损失殆尽。进而说明,合作关系是稳定的,且不会被破坏的。
基于对上述过程的分析,作者建立了一个基于回报的合作理论,基本内容就是:
一.合作的产生,需要一些外部条件,即未来对当前的决策足够重要。也就是未来双方会再次相遇,并基于历史记忆,可以对对方进行回报或惩罚;
二.在持续的相互作用中,基于回报的合作是最稳定的关系,特别是遵循善良性、宽容性、报复性、清晰性等特征的合作策略所建立的合作关系更加稳定。
2.4 一战战场上的“自己活也让别人活”系统是很好的回报合作理论的例子
一个很有趣的实例发生在第一次世界大战的堑壕战中,这是一个即使双方强烈对抗,合作还是能出现的例子。
在这个残酷的战争中,相互对立的人们之间发展出一个称为“自己活也让别人活”的系统。
如果接到命令,部队就相互攻击。但是在大战役的空隙,敌对的士兵却经常表现出很大的克制,每一方都尽量避免太多地伤害对方。
这种心照不宣的合作是不合法的,但也是很有特色的。尽管将军们有战争热情,但是这个系统仍自我发展和完善了好几年。
在固定防区中,相同的小单位长时间相互对峙,就是一个“重复囚徒困境”。对单步“囚徒困境”,背叛是最优选择;但是对于重复囚徒困境而言,则可能要有条件的选择策略。
在持续的交互作用中,稳定的结果就是基于回报的合作。
最开始的休战来自于双方的进餐。另外一种休战是糟糕的天气使进攻无法进行。
1915年的夏天,一个士兵发现,为了得到新鲜食物,敌人是愿意回报合作的。就是敌人不会攻击运送食品和水的车辆,因为如果攻击,敌人得不到食物,他也会让你得不到食物。
一旦开始,基于回报的策略就以各种方式扩展开来。短期的克制会延迟,一种克制会引发另外的克制行为,一个防区的情况会被另一个防区的部队模仿。
为了维持合作,双方需要有可激怒的策略。在克制期间,双方的士兵会努力证明,必要的话,他们会报复。同时告诉对方,克制不是由于软弱,背叛只能是自我伤害。例如:德国士兵通过射击墙上的一个黑点直到把它打成一个洞来向英军显示自己的威力。
最终破坏合作的是司令部发出的不停顿的进攻,这种进攻是必须有可以检查的结果的,如杀死或俘虏敌人,或自己被杀死。这种成百次的袭击,破坏了“自己活也让别人活”的合作系统。
总结来说,合作通过局部的探索行为而建立起来;由于相互对峙的小部队的持续接触自我维持下去;最终,这些小部队失去他们行动的自主权,合作因失去了基础而被破坏。
2.5 给管理者和参与者的一些建议
一、如果你是一个管理者,如果希望在组织中促成和加速合作关系的建立和发展,作者给出了自己的建议:
1)通过让双方相互作用更持久,更频繁来增大未来对当前决策的影响,如果未来相对于现在是足够重要的,双方的合作就是稳定的。因为每个对策者都可以用隐含的报复来威胁对方,在未来的接触中进行报复。
2)通过合作理论的教育,教育人们要回报,要互相关心,产生最初使用合作策略的群体,并且让合作的群体约束自己的破坏合作的行为,实现自我控制;
3)提升合作双方辨识合作和背叛的能力,没有这个能力,就不可能使用任何形式的回报来鼓励对方合作。同时,缺乏这个能力,将使合作范围受到限制,如曾经的无法核实对方在控制核武器上的行动,而让禁止核试验的合作无法进行。
4)改变合作和背叛行为的收益值,国家常常使用这个手段来鼓励合作和惩罚背叛。
二、如果你是个合作关系的参与者
请遵守下面的建议,避免被短期的利益诱惑,建立可以得到更多的长期好处的合作模式:
1) 不要嫉妒;事实是,一报还一报的策略从来没有一次游戏中比对方得更多的分,一报还一报不是靠打击对方,而是引出合作,与多种策略相处的好,使双方都有好处而胜出的。所以要避免零和博弈思维,要求自己比合作方做的好,这不是好的标准,这种比较会产生嫉妒,进而毁灭自我。如:你嫉妒你的供应商的利润是没有意义的。任何通过不合作来减少这种利润的企业,都会激起供应商的报复,诸如拖延发货,较低的质量保证等。这种报复使嫉妒的代价极大。
2)不要首先背叛;竞赛和理论分析的结果都表明,对方合作你合作就会有好处。善良的策略总是带来很大的优势。
3) 对合作和背叛都要给以回报;一报还一报的超常成功,给出了强烈的信息,就是要回报。
4)不要耍小聪明;竞赛结果表明,在“囚徒困境”情况下,人们容易耍小聪明,复杂的策略不比简单的策略更好。复杂的策略妄图通过推断来进行试探性的背叛,这些推断常常是错误的。会引来对方的报复。复杂的策略还把自己变的很难理解,让对策者无法得知下一步其将会如何选择,错失合作的机会。
4.结束语
现在大家应该明白了, 如果想拥有期望的合作关系:
首先要创造合作的外部环境,让持续的相互作用成为可能,可以帮助我们促进合作关系的建立;在合作过程中,采用“一报还一报”的策略,和避免采取破坏合作关系的行为,将保持合作关系的稳定性。
希望这些关于合作的知识能帮助我们构建美好的共赢的合作关系,让我们的生活,让各个国家,甚至这个星球在合作中变的更美好。
网友评论