美文网首页读书让生活美好那些年,我们读的那些书读书笔记
那些你知道或不知道的博弈 ——《博弈论的统计全集》

那些你知道或不知道的博弈 ——《博弈论的统计全集》

作者: 青衣语 | 来源:发表于2016-12-01 20:24 被阅读252次

    博弈论就是讨论人们在博弈的交互过程中如何决策的学问,不仅仅出现于经济、管理、政治、生物,也用于社交。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还要考虑自身决策行为对他人的可能影响,通过选择最佳行动计划,来寻求收益或效用最大化。

    《博弈论的统计全集》向人们介绍了二十种博弈模型,小二就简单地介绍其中几个自己感兴趣的模型给大家。

    图片来自网络

    囚徒困境

    话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离审讯。检察官说:“你们的偷盗罪确凿,所以可以判你们1年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你3个月的监禁,但你的同伙要被判10年刑。如果你拒不坦白,而被同伙检举,那么你就将被判10年刑,他只判3个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”

    小二出品

    显然最好的策略是双方都抵赖,结果是大家都只被判1年。

    这个是博弈论中最经典的入门理论,活路就是彼此信任,惩罚作弊者;比对手跑得快。

    智猪博弈

    智猪博弈是不同期望值之间的博弈,一方的期望值小于另一方。

    笼子里面有两只猪,一只大,一只小。笼子很长,一头有一个踏板,另一头是饲料的出口和食槽。每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。

    如果定量地来看,踩一下踏板,将有相当于10个单位的猪食流进食槽,但是踩完踏板之后跑到食槽所需要付出的“劳动”,要消耗相当于2个单位的猪食。

    如果两只猪同时踩踏板,再一起跑到食槽吃,大猪吃到7个单位,小猪吃到3个单位,减去劳动耗费各自2个单位,大猪净得益5个单位,小猪净得益1个单位。

    如果大猪踩踏板,小猪等着先吃,大猪再赶过去吃,大猪吃到6个单位,去掉踩踏板的劳动耗费2个单位净得4个单位,小猪也吃到4个单位。

    如果小猪踩踏板,大猪等着先吃,大猪吃到9个单位,小猪吃到1个单位,再减去踩踏板的劳动耗费,小猪是净亏损1个单位。

    如果大家都等待,结果是谁都吃不到。矩阵如下:

    小二出品

    可以得出结论,唯一解是大猪踩踏板,小猪等待。

    按照“重复剔除严格劣策略”的逻辑思路,剩下唯一的策略组合,即搭便车,紧跟策略。

    抢手博弈:

    彼此痛恨的甲、乙、丙三个枪手准备决斗。甲枪法最好,十发八中;乙枪法次之,十发六中;丙枪法最差,十发四中。

    先提第一个问题:如果三人同时开枪,并且每人只发一枪;第一轮枪战后,谁活下来的机会大一些?一般人认为甲的枪法好,活下来的可能性大一些。但合乎推理的结论是,枪法最糟糕的丙活下来的几率最大。

    来分析一下各个枪手的策略。

    枪手甲一定要对枪手乙先开枪。因为乙对甲的威胁要比丙对甲的威胁更大,甲应该首先干掉乙,这是甲的最佳策略。同样的道理,枪手乙的最佳策略是第一枪瞄准甲。乙一旦将甲干掉,乙和丙进行对决,乙胜算的概率自然大很多。枪手丙的最佳策略也是先对甲开枪。乙的枪法毕竟比甲差一些,丙先把甲干掉再与乙进行对决,丙的存活概率还是要高一些。

    多人博弈的情况,最后能否胜出,不仅取决于自己的实力,更取决于实力对比关系以及各方的策略:

    与强者正面交锋时,要避其锋芒;

    依据情势和自身实力,先发或者后发制人;

    在冲突的最初阶段,等距离外交,谁也不得罪,保存自己的实力;

    挑选对手结成同盟;

    保持谦逊、低调、圆融平和。

    路径依赖

    把五只猴子关在铁笼里,铁笼上面放一根香蕉,猴子伸手去拿香蕉,就有人用水枪喷它们,它们手放下去,水也就停了,猴子们都不再去打这根香蕉的主意,这时心理学家把笼子里的一只猴子放出,关进一只新来的猴子,这只新来的猴子看到香蕉就伸手去拿,另外四个知道拿香蕉就会被水喷,然后就把新来的猴子暴揍一顿,新来的猴子认为这根香蕉碰不得,就这样,学家们依次顺序把猴子换掉,到后来,只要有猴子去拿香蕉就被揍,被揍的不知道为什么挨揍,另外四个也不知道为什么要揍它。

    在现实生活中,存在着报酬递增和自我强化的机制。这种机制使人们一旦选择走上某一路径,要么进入良性循环的轨道加以优化;要么顺着原来的错误路径下滑。给我们的启示:初始选择至关重要,多在成功的地方选择机会。

    均衡博弈

    在均衡博弈中,一个优势策略优于任何其他策略;同样,一个劣势策略则劣于仍和其他策略。若果你有一个优势策略,可以采用;嫁入有一个劣势策略,则要避让。

    1.同时行动时,猜测对方现在在做什么,采取相应的最优策略;

    2.相继行动时,预测其他参与者接下来会有什么反应,据此盘算自己的最优策略。

    博弈法则:假如你有一个优势策略,请照办,不要考虑你的对手怎么做;假如你没有一个优势策略,但你的对手有,假定他会采用这个优势策略,相应选择最好的做法。

    3.没有优势时,提出所有劣势策略。

    以上就是我想分享的内容。

    相关文章

      网友评论

        本文标题:那些你知道或不知道的博弈 ——《博弈论的统计全集》

        本文链接:https://www.haomeiwen.com/subject/becfmttx.html