![](https://img.haomeiwen.com/i5611699/a0e56f7fb9a4a530.jpg)
生活中博弈无处不在,大到国家之间的贸易战,小到企业之间的价格战,微观到农夫种庄稼。你可能会感觉农夫种庄稼是一个人,和谁进行博弈?
实际上,并非只有一个人,还有一个叫做“自然”(Nature)的参与者。自然的策略可以是:天旱、多雨、风调雨顺。农夫对应的策略分别是:防旱、防涝、放心地休息。当然,“自然”究竟采用哪种策略并不确定,于是农夫只有根据经验判断或气象预报来确定自己的行动。如果估计今年的旱情较重,就可早做防旱准备;如果估计水情严重,就早做防涝准备;如果估计是风调雨顺,农夫就可以悠哉游哉了。
根据博弈的过程可以分为:轮流出招的博弈;同时出招的博弈;决策相互影响的博弈。
一、轮流出招的博弈
在博弈论中有个很古老的方法叫逆向归纳法,即"向前展望、倒后推理"。在轮流博弈中这个方法非常适用。
向前展望,意思就是在做决策之前,要预测对方可能会采取什么行为,以及这种行为会带来什么样的结果。这种思路就像咱们下棋的时候,每下一步,都要不断去猜对方下一步会怎么走。
倒后推理就是说,我们先得明确最后想达到一个什么样的目标,然后从这个目标倒着往后推,一步一步地确定策略。
“向前展望,倒后推理”这个方法能帮我们理解和分析很多复杂的问题。例如,工人罢工问题,工会与企业管理层谈判的过程就是一个博弈过程。工会希望用罢工给企业施加压力,让企业提高工资,增加福利,企业管理层呢,更希望维持现在的工资水平。
如果向前展望,每当工会提出要增加工资的时候,企业都可以选择同意或者不同意,然后工会再根据企业的决策做出自己的判断,决定要继续罢工还是开始工作。如果工人一直罢工,就失去了收入,同时企业也要承担很大的经济损失,所以罢工对双方都会产生伤害,罢工持续时间越长,造成的损失可能就越大。
这时候就需要倒后推理。工人和企业都是理性的,他们对自己的损失会有一个估计,会在恰当的时候达成妥协,结束罢工。什么是恰当的时候呢?对企业来说,只要罢工还在持续,损失就在增加。如果企业的目标是尽可能减少损失,那就应该把握住第一次谈判的机会,尽可能跟工会谈成一个合适的工资水平;对于工人们来说,在理想的情况下,为了减少损失,也希望尽早妥协。
向前展望,能帮我们列举未来所有的可能性;倒后推理,能帮我们从目标出发,找到博弈过程里最好的方案。
![](https://img.haomeiwen.com/i5611699/59949fb0830699c1.jpg)
二、同时出招的博弈
同时出招的过程,比较像我们平时玩的石头剪刀布游戏。在出招之前,我们不知道对方会出什么,必须设想如果自己处在对方的位置会出什么,然后再推算这么出会带来什么结果。也就是说,既要站在自己的角度考虑,还要站在对方的角度考虑。
在博弈论经典书籍《策略思维》一书中,针对这种同时出招的博弈,作者提出了三个策略:
一是选择你的优势策略
优势策略就是在一系列策略中,这个策略比你的其他策略都要好。比如要考试了,临时抱佛脚、抓紧时间好好复习就是一个优势策略,比放弃考试或者作弊要好;再比如,要维持身体健康,优势策略就是经常锻炼、多吃水果蔬菜,比生病后去医院看病要好。
二是避免你的劣势策略
劣势策略就是对你最不利的那个策略。比如,你的篮球队在打一场比赛,距比赛还剩几秒钟,你的球队领先两分,到现在对手却手握球权,现在应该怎样安排防守策略呢?我们分析一下,你的对手有两个策略:一是打两分,如果球进了,进入加时赛;二是打三分,如果球进了,你的球队将被绝杀。这时,你也有两个策略:一个是防止对方打两分,一个是防止对方打三分。这时,防守两分就是一个劣势策略,因为一旦对手三分球进了,你的球队就会被绝杀,所以,你的最佳选择是防守对方的三分球。
三是寻找这个博弈的均衡,也就是均衡策略
均衡策略就是参与博弈的每一方都找到了针对另一方的最佳对策。它是由著名数学家、博弈论创始人约翰·纳什提出来的,也叫做纳什均衡。
纳什均衡有一个很形象的应用场景,出现在一部奥斯卡获奖电影《美丽心灵》里。这个场景是这样的,说纳什在普林斯顿大学上学的时候,和几个同学在学校酒吧里讨论怎么追女生。一个同学分析,亚当·斯密说个人利益会推动集体利益,咱们先去追求最漂亮的女生,如果被拒绝,然后再去追求其他女生。但是纳什认为,这事儿不能光考虑自己,还要考虑男生、女生和所有同学整体。纳什分析说:每个人都想追求最漂亮的那个女生,这是人之常情,不过如果大家都去追求她的话,肯定会有人遭到拒绝;如果遭到拒绝后,再去追求其他女生,会有很大的概率再次被拒绝,因为没有人喜欢当备胎;所以,对大家来说,最好的策略就是都不去追求最漂亮的那个女生,而是直接各自追求其他女生,这样对所有人都有利。
同时出招的博弈就是一个循环推理的过程,首先要找出自己的优势策略,尽量选择它;然后找出自己的劣势策略,尽量避免;最后不断简化博弈过程,找到博弈的均衡,也就是每个人的策略都是回应对方的最佳策略。
![](https://img.haomeiwen.com/i5611699/4bec34d24bd174fb.jpg)
三、决策相互影响的博弈
如果我们和对手的决策会互相影响,那怎么防止对手预测我们,我们又应该怎么去影响对手?
怎么防止对手预测我们呢?有一招是随机策略。也就是说,用一种不可预测的方法做出你的决策,这时对手就很难预测你的行为。体育比赛中经常会用到随机策略。比如,在篮球比赛中,如果一个球员的左右手都可以投篮,那么防守他就会很困难,因为每一次都要考虑他是会用左手投还是右手投。
那我们又该怎么去影响对手呢?有两个很管用的方法,一个是威胁,另一个是许诺。
威胁说的是对不肯跟你合作的人进行惩罚。比如,你想让你的客户提前支付货款,那你可以说“如果您无法提前支付货款的话,那我们的到货时间可能就没办法保障”。这就是一个威胁。
许诺就是给愿意跟你合作的人提供回报。比如,你想让部门员工努力工作,那你可以说“大家辛苦辛苦,等这个项目忙完了,给大家好好放个假”。
![](https://img.haomeiwen.com/i5611699/420f577509a2ae2e.jpg)
上面,我们都是说的怎么在博弈中战胜对方,那博弈能不能维护共同利益呢?
囚徒困境的案例大家都熟悉,囚徒的困境在于,两个人都做出了看上去对自己最有利的选择,实际上却陷入了一个对双方都不利的困境中。
经济学家何帆在得到课程中专门分析了囚徒困境。他说,囚徒困境跟三个因素有关:博弈各方在不同策略下的成本和收益,博弈的次数,参与人数。
博弈各方的成本和收益——
要是把囚徒困境里的成本和收益改一下,囚徒困境就不存在了。比如,被审讯的是一对真心相爱的夫妻,宁可一起坐牢,也不愿意背叛对方。或者,被审讯的两个人都是黑帮成员,如果有人坦白交代了,即使被放出来,也会被黑帮杀死,也就是说,背叛的成本无穷大。在这些情况下,都不会出现囚徒困境。
博弈次数——
如果被审讯的这两个人谁也不认识谁,对方要坐几年牢跟自己没关系,那互相背叛的概率就很高;如果他们是熟人,以后还会再见,还有合作的可能,那背叛对方的概率就会很低。
参与人数——
经典的囚徒困境里接受审讯的只有两个人,他们串供的概率比较高,如果是100个人接受审讯,串供的概率就会大大降低,而且,想浑水摸鱼的人也更多。
如果囚徒困境已经形成了,怎样才能跳出这个困境,维护共同利益呢?在《策略思维》一书中,作者给出的答案是:对背叛进行严格的惩罚。
经济学家何帆老师认为:
博弈论持一种悲观现实主义的世界观,它不承认人会大公无私地奉献,人与人之间充满了欺诈和背叛,但是这样一种悲观的思想,却能推导出非常乐观的结论。博弈论告诉我们,即使这个世界很灰暗,但乐于合作的好人最终是会胜出的。
有一位博弈论专家做过一个实验,把代表各种游戏规则的程序输入计算机,让这些策略相互博弈,最后胜出的策略叫做“一报还一报”。
这个策略一共就三条:第一,不主动背叛别人;第二,以牙还牙;第三,如果你背叛我之后,又回心转意,又愿意合作,那我不计前嫌,继续跟你合作。
这个策略在最开始会吃亏,但是只要有一小部分人一直坚持这个策略,就能生存下来,还能吸引越来越多的人加入他们。也就是说,即便这个世界已经沉沦,只要有一小批人愿意跟你坚持道德底线,你还能过得很好,没人能强迫你堕落。
网友评论