火树科普博弈论

作者: ChrisChen萌美丽 | 来源:发表于2019-05-02 16:20 被阅读12次

    昨天关注了密室大逃脱的大神之一清华博士火树的微博。

    清华博士火树

    发现了他在B站上的一个科普视频 - 火树带你学博弈论。

    火树带你学博弈论

    下面是我今天学习的读书笔记。

    博弈论定义

    双方都有两个以上的选择,为了对抗对方的策略选择。

    博弈论分为合作和不合作

    合作, 指双方谈判,采取联合策略(本课不涉及)

    不合作,指双方不存在谈判和协议的执行

    博弈论三要素

    参与者:要搞清楚是和谁在博弈。避免发生螳螂捕蝉,黄雀在后的情况。即博弈对象错误。

    策略集:双方都有各自的两个以上的策略选择

    收益:要区分是名还是利。对名的追求具有竞争性。名一般为个人所有,一个人得到,其他人就不可得。而利是可以在多人之间共享的。

    名,利不是一回事

    吕氏春秋有个故事,叫子贡赎人和子路受牛。故事是这样的。

    鲁国有一条法律,鲁国人在国外沦为奴隶,如果有人能把他们赎出来的,回国后就可以到国库中报销赎金。有一次,孔子的弟子子贡(端木赐)在国外赎回了一个鲁国人,回国后不接受国家赔偿金。孔子说:"你做错了,从今以后,鲁国人就不再愿意为在外的同胞赎身了。你如果接受了国家的补偿金,并不会损害你的行为;而你不肯拿回你抵付的钱,别人就不肯再赎人了。这就是子贡赎人拒金的故事。

    又有一次,孔子的另一个弟子子路救起一名落水者,那人为了感谢他就送了他一头牛,子路收下了。孔子说:“这下子鲁国人一定会勇于救落水者了。”这既是子路受牛的故事。

    理性人假设

    这是博弈论一个重要的假设,也叫强敌假设。指参与者追求收益最大化,并且会根据对手的策略进行调整。

    经典案例分析-  囚徒困境 prisoner‘s dilemma

    收益矩阵图

    情景是这样的:有两个窃贼被抓,分别关在两个房间。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都沉默,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个沉默,坦白的放出去,沉默的判二十年。

    分析如下:对于甲来说,乙有坦白和沉默两种选项。在乙坦白的选项下,甲坦白比沉默收益大,只需要坐8年的牢。在乙沉默的选项下,还是甲坦白的收益大,获得自由。同理可证乙的选择也是坦白为最大收益。但是,如果两人都沉默,各判一年,显然这个结果是更好的。为什么和单独判断不一致呢?

    个人最佳选择并非团体最佳选择

    结论就是,在追求利益最大化的前提下,两个人都选择坦白是双方都无法获得更大收益的结果,也是博弈最终平衡的结果。人类的个人理性有时能导致集体的非理性。

    未完待续……

    相关文章

      网友评论

        本文标题:火树科普博弈论

        本文链接:https://www.haomeiwen.com/subject/inbnnqtx.html