简单认识博弈论

作者: 余仲泉 | 来源:发表于2018-03-17 12:43 被阅读343次

        从美国心理学家赫尔伯特·西蒙提出人的“有限理性”理论修正古典经济学家提出的“完全理性经济人”后,如何更科学有效、理性的做出利益最大化的决策是每一位决策者都在思考的问题。

        从1928年冯·诺依曼证明了博弈论的基本原理后就宣告了博弈论的正式诞生,至此经过数十年的发展,博弈论已经成为一门影响政治学、经济学、金融学、国际关系、管理学、决策学、军事学等多个领域的重要学科,而如何使用博弈的理论进行更科学、理性的决策也是每一位希望最大效益决策的经济人希望掌握的能力。

        目前关于博弈学的书籍市面上可以说是多如牛毛,然而质量也是参差不齐,然而根据诺贝尔经济学奖获奖者,同时也是哈佛大学专门教授博弈论课程的托马斯·谢林教授在哈佛大学的博弈论课程撰写而成的《哈佛大学发博弈论课》,算是其中非常不错的博弈论书籍。

        什么是博弈论

        博弈论这个名字源自经济学家奥斯卡·摩根斯坦和数学家冯·诺伊曼在1944年发表的著作《博弈论与经济行为》一文中作者对于跳棋和象棋等室内游戏特征的观察。这些游戏都有各自的规则和得分体系,比赛双方拥有的信息量在特定时刻都是特定的。而且最为重要的是,双方在比赛过程中所做的决策相互影响,而且最为重要的是双方在决定走出一步之前都要去思考对手是如何打算下一步的。

        由此看来,博弈论就是对理性决策的互动决策过程的研究。博弈者在行动过程中要努力使自己的利益最大化或者实现自己的最好结果。

        博弈中的囚徒困境

        囚徒困境,是所有有关博弈论的资料都会提及的案例,它其实就是博弈论二阶矩阵的工具,每一名博弈者只能在两种选择中选择其一。

    二阶矩阵

        囚徒困境,简单的来讲就是有甲、乙两名嫌疑人被警方抓住了,被分别囚禁在两个不能互通信息的房间里,警方对于这两名嫌疑人给出以下四个选择:

    A、两人都认罪,两人都判5年;

    B、甲认罪,乙不认罪,甲被判1年,乙被判10年;

    C、乙认罪,甲不认罪,乙被判1年,甲被判10年;

    D、甲、乙两人都不认罪,两人无罪释放;

        从这个选择的博弈来说,利益最大化是甲、乙两人都不认罪,这样子就被判无罪释放,但是,在一个无法沟通信息的环境里,如果其中一人不认罪,另一人认罪了,那么认罪的一方会被从轻发落,而拒不认罪的一方则会受到严重惩罚;而如果两人都认罪,则会受到中等的惩罚,作为甲、乙两人应该如何做出让自己利益最大化的选择呢?

    囚徒困境

        从这个决策图中我们可以代入甲的角色思考:如果我认罪了,乙不认罪,我一年,乙10年;如果我认罪了,乙认罪了,都是5年;而假如我不认罪,乙认罪,那么我是10年,乙是1年;因为不知道乙会不会认罪,如果自己认罪最好结果是判1年,最坏结果是判5年;而自己不认罪,最好结果是无罪释放,最坏结果是判10年,基于理性的考虑,甲做出认罪的选择是自己利益最大化的选择。

        这个时候我们同时代入乙的角色,同样的理由,自己认罪是利益最大化的选择,最终这个博弈会以双方都认罪而结束。这就是依据对方的选择来判断自己的选择,从而让自己利益最大化的博弈论决策。

        我们看到这个二阶矩阵是两个角色的四种选择,那么如果人数增多了呢,如果变成3个人的博弈决策就会变成三阶矩阵,结果就从原来的4种变为9种,人数越多,其决策的结果判定就会有越多的变数,这个时候就要去思考如果在众多利益纷争中自己的决策利益最大化,这就是博弈论决策能够带来的益处。

     博弈中的动态均衡

        通过前文的描述我们可以知道博弈的每一个结果都在影响竞争对手的策略,而竞争对手的策略则会进一步影响自己的下一步的策略,所以这是一个在系统内动态影响的过程,不是静止的,不是说一个决策后就是按照这样的决策进行行动,而是在决策后根据竞争对手的下一步行动再来改变自己的行动。

        在这里,我们可以用一个有趣的社会心理学实验来说明这个观点。

        研究者制作了100张卡片,卡片写上1~100共100个数字。研究者随机找来男女大学生各50名,单数卡片给男生,双数卡片给女生,被试者并不知道贴在自己背后的数字是多少。

        在实验过程中,大家可以看到别人背后的数字,也可以任意交谈,但是不能把对方的编号告诉他。实验要求:在规定时间内找一个异性配对,两个人背后的数字加起来越大,获得的奖金越高;如果落单,则拿不到奖金。

        很快,数字大的人身边就会出现很多想跟他们结合的人。如此,这个人虽然不知道自己背后的数字,但是根据他人的态度,能推断出自己背后数字的大小程度。推测出自己背后数字高的人,眼光开始变得挑剔;而碰壁者则会退而求其次,原本想找90以上的,慢慢觉得80可以,甚至70也凑合。在最后的倒计时阶段,还没配对的人会草草找人完成任务,也有坚持不配对保持单身的人。

        实验结束后,研究者发现:绝大多数人的配对对象背后的数字都与自己的数字接近。两人相差20以上的情况相当罕见。但有趣的是,100号女生配对对象背后的数字竟然是73。100号女生总是在等待更大数字的男人出现,然而等大家都配对完毕,自己却慌了,于是从剩下的男生中找了一个数字最大的。

        这个实验表明:每个人都希望找到最佳的伴侣,也就是跟自己价值相等或者比自己价值高的伴侣;而两个人的价值最接近时,价值和才最大。

        我们把这个实验置换于社会体系中的男女价值判断和动态博弈论中我们就可以看到,我们根据社会价值体系把男女分为A男、A女、B男、B女、C男、C女,一开始肯定是A、B、C男都找A女,然而A女发现自己的价值,就开始挑起来,然后男性群体里面就会有人开始退出找B女和C女,这个时候就会变成A男与B女,B女与C男,而最后A女和C男就被单下来了,而随着时间的推移,整个动态博弈系统在进行变化,A女的价值会开始有折损,这时就会出现A1女开始和B1男配对,整个系统就会开始在这个动态博弈的过程中变化。

        当然最后也在此声明:引用这个实验并有没有其他意思,只是为了论证在进行博弈决策的时候,不应该是静止的进行决策判断,而应该在系统内进行动态的决策思考。

    相关文章

      网友评论

        本文标题:简单认识博弈论

        本文链接:https://www.haomeiwen.com/subject/kexjqftx.html