万维刚《博弈论15讲》笔记

作者: 胡一凡_非暴教练 | 来源:发表于2020-10-06 23:01 被阅读0次

万维刚《博弈论15讲》笔记
228/1000 万维刚讲博弈论
229/1000 万维刚讲博弈论
232/1000 博弈改变人
231/1000 博弈论不是“36计”
254/1000 先下手为强1/博弈论
255/1000 博弈论2.先下手为强
236/1000 装好人的好处
如何制定目标（一）
我想成为一个player

万维刚《博弈论15讲》笔记

01博弈论不是三十六计

中国传统谋略，比如三十六计，基本都是阴谋诡计，但轨迹有问题：

轨迹都有巨大风险。不仅要封锁信息，还假设对方比较愚蠢，比如空城计
轨迹不能长期使用。比如瞒天过海
轨迹说的都是零和游戏。比如围魏救赵、远交近攻，而真实世界当中除了战争，很少是你死我亡的零和游戏。
总结：计谋的本质是一厢情愿

中国可能是计谋大国，而不是战略强国。
六神磊磊说，所谓国师，不过是李师师。

博弈论研究的是理性人之间的博弈。
人在做熟悉的、重要的、涉及到钱的事情上通常还是理性的。
博弈论假设人是理性的有下面三个要求：

第一，你得知道你想要什么，并且对你想要的东西有一个明确的排序。
第二，你的行动是在一定的规则之下争取你想要的东西。
第三，你知道对手也是这样想的，而且对手也知道这些规则。

如果一个现象长期存在，也就是“均衡”，就是博弈论的研究对象，偶尔的非理性不是。

博弈论除了让我们理解那些表面不合理却长期存在的现象，更重要的是如何改变不好的局面。
人们之所以用不上博弈论，是因为缺少识别博弈格局的眼光和改变博弈规则的意识。

首先要理性，就像下棋考虑每一步自己和对手的反应；更深层的意识是做一个player（参与者），在规则范围内采取对自己最有利的行动，积极主动，平等对待对手。

02群鸦的盛宴

不做道德判断，哪怕所有人都不喜欢这个局面，但所有人都只能维护这个局面。

1、帕累托最优
怎样解释商家扎堆现象？这是不得不，因为要考虑竞争对手。
例子：沙滩上卖冰淇淋

帕累托改进：这个改进能在不伤害任何一个人的利益同时，使得至少一个人的境遇变得更好。
如果一个局面已经好到没有帕累托改进的余地了，这个局面就是帕累托最优。

商家均匀分散才是最优，那为什么不是呢？因为这个最优局面不稳定，后来者可以打破。理想青年喜欢帕累托最优，但是博弈论告诉我们只有稳定的局面才能长期存在。

2、压倒性策略
在“囚徒困境”当中，不管对方是否招供，囚徒甲的最好策略都是招供。
这就是压倒性策略，这种策略压倒其他一切策略。
不管别人怎么做，你这么做对自己都是不好的，这叫被压倒性策略。
3、纳什均衡
有这么一种局面，在这个策略组合里面，没有任何一方愿意单方面改变自己的策略。换句话说，不管我们是否喜欢，这个局面我们认了。
就是因为人人都不愿意先变，那这个局面就变不了。

如果一个现象能在社会中长期稳定的存在，那它对于参与各方来说就一定是个纳什均衡。
评价一个局面不能只看它对整体是否最好，它必须得让每一个参与者都不愿意单方面改变才行。

理想青年喜欢帕累托最优，理性青年寻找纳什均衡。
战国时代，必然陷入军备竞赛，因为不是纳什均衡。秦国用强权统一之后，压倒性策略就是要用武装力量镇压内部，结果弄反了。老百姓陷入的是多人囚徒困境，有人带头就必然能造反成功。

互联网上自媒体的涌现，就破除了商家扎堆现象，原因是市场门槛变低了，市场足够大，小成本也能经营，并且获利。

推荐张维迎著作《博弈与社会》

03以合为贵

合作永远是好的，能带来整体的长期的利益。
好的合作一定得是个纳什均衡。
世界上最完美的法律是交通法规。比如右侧通行就是一个纳什均衡，因为没有谁会单方面想改变此局面。
有些博弈中有多个纳什均衡，怎么选择呢？
发明了矩阵图的托马斯·谢林在《冲突的策略》中说，你可以根据约定俗成选择。
比如两个人约定明天在纽约见面，没说具体时间地点，那你最好选择中午12点在中央地铁站等。
这就是“聚焦点”。
经得起考验的概念一旦说破之后就随处可见。

聚焦点有用的前提：各方没有根本利益冲突，都想促成合作。只是要找到在哪里合作。
想要合作的人需要聚焦点，任何借口都可能是聚焦点。

只要合作的愿望大于冲突，我们就还是可以使用聚焦点。
总结：如果各方都有合作的强烈愿望，而博弈存在多个纳什均衡，我们要做的就是找到聚焦点。

04不纵容，但要宽容

凡是合作两利，背叛两伤的都是囚徒困境。但生活中存在背叛有巨大利益的时候。
防止背叛最好的方法就是把单次博弈变成重复博弈。

麦克·亚当斯在《游戏改变者》中说，一群人想要合作，至少要满足两个条件之一：

第一是合作对自己有好处，人们本就想合作；
第二是不合作就会受到惩罚。
美国黑手党就是这样。

有效的惩罚必须满足下面三个条件：

首先你得能发现背叛行为；
然后惩罚必须是可信的，而且对方要知道他一定会受到惩罚；
再者惩罚的力度得足够。

同样是举报免责，为什么卡特尔垄断联盟就比黑手党容易瓦解呢？可能一是卡特尔没有惩罚错失，二是黑手党主要是意大利移民，利用家庭和亲缘增加互信。

利益和惩罚只是硬条件，如果内部没有起码的信任，合作就是脆弱的。

物理学家思维，不仅考虑一个情景的可实现性，还要考虑它的稳定性。

重复博弈里，怎样的机制才是稳定的呢？——TFT（以牙还牙），

05装好人的好处

1、囚徒困境实验，居然有一半人选择宁肯对方背叛，自己也不背叛，也就是做好人。为什么呢？

可能是对游戏还不熟练。我们对熟悉的事情更理性，就像有人生阅历后变得成熟。
但另外的实验出现悖论，如果是固定跟某个人玩游戏，那也多是合作，最后才会选择背叛，即面对熟人更愿意做好人。

2、在有限次重复博弈当中，如果我们从最后一次博弈必然背叛来倒推，那么每一次都应该选择背叛，可现实生活中并非如此，这是为什么？

一种解释是现实中的博弈虽然是有限次的重复，但因为是随机的，所以你不知道下次什么时候博弈，什么时候不再博弈，所以愿意合作，避免未来可能的惩罚。
另一种解释是“四人帮模型（KMRW四位经济学家1982）”，就算我们知道未来有多少次博弈，理性选择也应该是先合作。

这是因为对方到底是不是个理性的人，这个信息是不完备的，这叫“不完全信息博弈”。如果双方都知道对方是理性的，那有限次重复博弈就不会有合作。
当你面对一个好人时，你是选择合作还是背叛呢？你应该选择合作，就像黄蓉（理性人）面对郭靖（好人）。
在不完全信息博弈中，参与者不知道对方是好人还是理性人，那么只要博弈的次数足够多，合作就能够带来足够的好处，双方都愿意维护自己是好人这个名誉，前期尽可能合作，到最后才背叛。

张维迎在《博弈与社会》中说KMRW理论可以解释大智若愚，“智”是自私理性，“愚”是宁可自己吃亏也不要背叛。选择“愚”是大智慧，可以积累声誉赢得更多人的合作。

3、那装好人要装到什么程度为止呢？
在有限次重复博弈当中，一般是倒数第二次双方才暴露出理性人的面目，选择背叛。比如领导干部的59岁现象。

博弈论专家不建议你去做真正的好人（康德式好人），因为好人经常一厢情愿，认为可能感化对方，这在险恶社会很危险。

话说回来，做真正好人是有一个重大好处——你会自我感觉很好，以至于你为了维护这种感觉而不惜金钱利益。这也是为什么在开头的实验中有一半的人选择了先合作。
文化教育的熏陶让我们活在一个好人世界的想象共同体当中，有时候我们甚至认为物质利益都是不重要的，这是幻觉，也是理性，只要你知道心中什么最重要就可以。

万维刚《博弈论15讲》笔记
万维刚《博弈论15讲》笔记 01博弈论不是三十六计中国传统谋略，比如三十六计，基本都是阴谋诡计，但轨迹有问题： ...
228/1000 万维刚讲博弈论
得到/万维刚/博弈论/认知提升见：改变规则就是改变局面。感：你想到的，对方也都想到了，博弈论讲究的是在对等聪明...
229/1000 万维刚讲博弈论
得到/万维刚/精英日课/博弈论见：“很多时候是自由带来困境，限制带来活力。” 感：博弈论中改变规则会改变局面。但...
232/1000 博弈改变人
得到/万维刚/精英日课3/博弈论见：学习博弈论，就是要改变规则，改变博弈局面，因为博弈改变人。感：“博弈论要求...
231/1000 博弈论不是“36计”
得到/万维刚/精英日课/博弈论见：博弈论不是阴谋是阳谋。阴谋也称诡计，诡计的得逞，要假设对方是愚蠢的，所以行使...
254/1000 先下手为强1/博弈论
得到/万维刚/博弈论见：动态博弈的本质不是轮流出招，而是你可以改变游戏的规则。感：博弈论的本质不是小白兔式的“...
255/1000 博弈论2.先下手为强
得到/万维刚/博弈论/精英日课见：“威慑有三个要素：实力、决心和让对手知道。” 感：博弈论中首先要求双方都有理性...
236/1000 装好人的好处
得到/万维刚/精英日课/博弈论见：博弈论专家绝对不会建议你去做真正的好人。好人经常对世界有一厢情愿的期待。感：...
如何制定目标（一）
终于要交第一次作业了，因近期在听万维钢老师讲的博弈论，打算写个复盘笔记作为第一次作业，因在开班仪式上，军师姐姐说：...
我想成为一个player
在学习万维刚老师的博弈论之前，我对博弈论的认识就是囚徒困境：以为博弈就是双方或者三方勾心斗角联吴抗曹，赢了就是三分...

万维刚《博弈论15讲》笔记

01博弈论不是三十六计

02群鸦的盛宴

03以合为贵

04不纵容，但要宽容

05装好人的好处

相关文章

万维刚《博弈论15讲》笔记

228/1000 万维刚讲博弈论

229/1000 万维刚讲博弈论

232/1000 博弈改变人

231/1000 博弈论不是“36计”

254/1000 先下手为强1/博弈论

255/1000 博弈论2.先下手为强

236/1000 装好人的好处

如何制定目标（一）

我想成为一个player

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读