昨天关注了密室大逃脱的大神之一清华博士火树的微博。
清华博士火树发现了他在B站上的一个科普视频 - 火树带你学博弈论。
火树带你学博弈论下面是我今天学习的读书笔记。
博弈论定义
双方都有两个以上的选择,为了对抗对方的策略选择。
博弈论分为合作和不合作
合作, 指双方谈判,采取联合策略(本课不涉及)
不合作,指双方不存在谈判和协议的执行
博弈论三要素
参与者:要搞清楚是和谁在博弈。避免发生螳螂捕蝉,黄雀在后的情况。即博弈对象错误。
策略集:双方都有各自的两个以上的策略选择
收益:要区分是名还是利。对名的追求具有竞争性。名一般为个人所有,一个人得到,其他人就不可得。而利是可以在多人之间共享的。
名,利不是一回事
吕氏春秋有个故事,叫子贡赎人和子路受牛。故事是这样的。
鲁国有一条法律,鲁国人在国外沦为奴隶,如果有人能把他们赎出来的,回国后就可以到国库中报销赎金。有一次,孔子的弟子子贡(端木赐)在国外赎回了一个鲁国人,回国后不接受国家赔偿金。孔子说:"你做错了,从今以后,鲁国人就不再愿意为在外的同胞赎身了。你如果接受了国家的补偿金,并不会损害你的行为;而你不肯拿回你抵付的钱,别人就不肯再赎人了。这就是子贡赎人拒金的故事。
又有一次,孔子的另一个弟子子路救起一名落水者,那人为了感谢他就送了他一头牛,子路收下了。孔子说:“这下子鲁国人一定会勇于救落水者了。”这既是子路受牛的故事。
理性人假设
这是博弈论一个重要的假设,也叫强敌假设。指参与者追求收益最大化,并且会根据对手的策略进行调整。
经典案例分析- 囚徒困境 prisoner‘s dilemma
收益矩阵图情景是这样的:有两个窃贼被抓,分别关在两个房间。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都沉默,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个沉默,坦白的放出去,沉默的判二十年。
分析如下:对于甲来说,乙有坦白和沉默两种选项。在乙坦白的选项下,甲坦白比沉默收益大,只需要坐8年的牢。在乙沉默的选项下,还是甲坦白的收益大,获得自由。同理可证乙的选择也是坦白为最大收益。但是,如果两人都沉默,各判一年,显然这个结果是更好的。为什么和单独判断不一致呢?
个人最佳选择并非团体最佳选择
结论就是,在追求利益最大化的前提下,两个人都选择坦白是双方都无法获得更大收益的结果,也是博弈最终平衡的结果。人类的个人理性有时能导致集体的非理性。
网友评论