美文网首页博弈论首页投稿(暂停使用,暂停投稿)想法
博弈论沉思12信息越多,获胜的可能就越大

博弈论沉思12信息越多,获胜的可能就越大

作者: 玩哲录 | 来源:发表于2017-11-24 16:43 被阅读2842次

    56信息越多,获胜的可能就越大

    一个商人要招个伙计,来了两个应征者,他们同样勤快,商人决定不下要用哪一人,他希望店里的伙计要精明一些,因此他把两个人叫到屋坦克,取出5顶帽子,两顶红的,三顶黑的,他要求他们三人蒙上眼睛,每人取了一顶帽子戴在头上,他告诉他们:摘下眼罩后,谁先说出自己戴的帽子的颜色,就先留下谁。

    摘下眼罩后,两人发现商人戴了一顶红帽子,两人互相看一眼,其中一人说:“我的帽子是黑的。”

    为什么?

    其实对手的反应帮了他的忙。如果对手足够聪明的话,可以采取以下战略:不摘下眼罩,也不看对方,这么做似乎要吃亏,其实正好相反,因为如果自己戴的是红帽子,无论知不知道对方帽子的颜色,他都会输,可是,如果对方不做判断,就可以判断自己戴的是黑帽子。

    著名的BF实验-如果我们根本不能从别人那得到有用的信息,怎么办?

    把几只蜜蜂和几只苍蝇放进一个玻璃瓶中,然后将瓶子平放,让瓶底朝向窗户,结果会怎样呢?你会看到,蜜蜂不停地在瓶底寻找出口,直到累死为止,而苍蝇则在不到两分钟内全部逃出。为什么呢?

    因为蜜蜂喜欢光亮而且有智力,于是他们坚定的认为,出口一定在有光亮的地方,于是他们不停地重复这一合乎逻辑的行为。而苍蝇呢?它们对事物的逻辑毫不在意,而是到处乱飞,探索有可能出现的任何机会,于是他们成功了。

    实验、试错、冒险、即兴发挥、迂回前进、混乱、随机应变,所有这些都有助于应付变化,要善于打破固定的思维模式,要有足够的探索未知领域的学习能力。

    这说明,将计就计-掌握的正确信息越多,获胜的可能就越大。

    57不完全信息动态博弈的基本思路

    成语故事:黔之驴-驴虎博弈

    黔无驴,有好事者船载以入。至则无可用,放之山下。虎见之,庞然大物也,以为神,蔽林间窥之。稍出近之,慭慭然,莫相知。

    他日,驴一鸣,虎大骇,远遁;以为且噬己也,甚恐。然往来视之,觉无异能者;益习其声,又近出前后,终不敢搏。稍近,益狎,荡倚冲冒。驴不胜怒,蹄之。虎因喜,计之曰:“技止此耳!”因跳踉大㘎,断其喉,尽其肉,乃去。

    噫!形之庞也类有德,声之宏也类有能。向不出其技,虎虽猛,疑畏,卒不敢取。今若是焉,悲夫!

    老虎通过不断试探来修正对毛驴的看法,每一步行动都是给定它的信念下最优的。最终将毛驴吃掉。

    类型:自然首先选择参与人的类型,参与人自己知道,其他参与人不知道。——不完全信息

    行动:行动有先有后,后行动者能观测到先行动者的行动,但不能观测到其类型。——动态博弈

    但是,参与人是类型依存型的,每个参与人的行动都传递有关自己类型的信息,后行动者可以通过观察先行动者的行动来推断自己的最优行动。先行动者预测到自己的行动被后行动者利用,就会设法传递对自己最有利的信息。

    58不完全信息动态博弈过程

    不完全信息动态博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的过程。

    精练贝叶斯均衡是泽尔腾不完全信息动态博弈子博弈精练纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。

    如:低成本的在位者不会选择p=6,因此,如果进入者观察到在位者选择了p=6,就可以推断在位者一定是高成本,选择进入是有利可图的。预测到p=6会招致进入者进入,即使高成本的在位者也可能不会选择p=6,而招致进入者的进入。相反,低成本在位者也不会选择p=5,如果p=5会招致进入者进入的话。

    问题的核心是:不同的价格如何影响进入者的后验概率从而影响进入者的进入决策。

    一个非单阶段最优价格会减少现期利润,但如果它能阻止进入者进入,从而使在位者在第二阶段得到的是垄断利润而不是库诺特均衡利润,如果垄断利润与库诺特均衡利润的差距足够大,如果在位者有足够的信心选择一个非单阶段最优价格可能是最优的。

    而且,不同的价格影响进入者的后验概率从而影响进入者的进入决策。

    在均衡情况下,在位者究竟选择什么价格,不仅与成本函数有关,而且与进入者的先验概率x有关。而不关x为多少,单阶段最优垄断价格不构成均衡。

    ——这些都是直接影响在位者和进入者的最终决策。

    综合这些因素,得到的均衡才是精炼的均衡。

    在静态贝叶斯均衡中,参与人的信念是事前给定的,均衡该概念没有规定参与人如何修正自己的信念。但是,如果进入者可以任意修订自己有关在位者成本函数的信念,上述不完全信息动态博弈可以有任意均衡。

    如假定x<1/2,下列战略组合是一个贝叶斯均衡:不论在位者选择什么价格,进入者总认为在位者是低成本的概率为x*<1/2,总是选择不进入;搞成本在位者选择p=6,低成本在位者选择p=5。但显然这个均衡是不合理的,因为它包含了一个不可臵信威胁:进入者不会修正对在位者成本函数的信念。

    给定p=6不可能是低成本在位者的最优选择,如果在位者选择了p=6,进入者为什么仍然认为在位者是高成本的概率小于1/2呢?

    59不完全信息动态博弈的精练贝叶斯均衡

    完全信息动态博弈中引入了子博弈精练纳什均衡的概念概念剔除那些不可臵信的威胁,但是不完全信息动态博弈中,只有一个子博弈,不能将上述方法直接用于求不完全信息动态博弈的均衡解,但可以借用这一方法逻辑。

    将每个信息集开始的博弈的剩余部分称为一个“后续博弈”,一个“合理”的均衡应该满足如下要求:给定每一个参与人有关其他参与人类型的后验信念,参与人的战略组合在每一个后续博弈上构成贝叶斯均衡。

    剔除这种不可信行为的方式是:假定参与人(在所有可能情况下)根据贝叶斯规则修正先验概念,并且,每个参与人都假定其他参与人选择的是均衡战略。

    精练贝叶斯均衡是贝叶斯均衡、子博弈精练均衡和贝叶斯推断的结合。它要求:

    1、在每个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念);

    2、给定该信息集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的;

    3、每一个参与人根据贝叶斯法则和均衡战略修正后验概率。

    古希腊哲学导师苏格拉底的三个弟子曾求教老师,怎样才能找到理想的伴侣。苏格拉底没有直接回答,却让他们走麦田埂,只许前进,且仅给一次机会选摘一支最大的麦穗。

    第一个弟子没走几步就看见一支又大又漂亮的麦穗,高兴地摘下了。但是他继续前进时,发现前面有许多比他摘的那支大,只得遗憾地走完了全程。

    第二个弟子吸取了教训。每当他要摘时,总是提醒自己,后面还有更好的。当他快到终点时才发现,机会全错过了。

    第三个弟子吸取了前两位的教训。当他走到三分之一时,即分出大、中、小三类,再走三分之一时验证是否正确,等到最后三分之一时,他选择了属于大类中的一支美丽的麦穗。

    虽说,这不一定是最大最美的那一支,但他满意地走完了全程。

    相关文章

      网友评论

      • 玩哲录:实验、试错、冒险、即兴发挥、迂回前进、混乱、随机应变,所有这些都有助于应付变化,要善于打破固定的思维模式,要有足够的探索未知领域的学习能力。

      本文标题:博弈论沉思12信息越多,获胜的可能就越大

      本文链接:https://www.haomeiwen.com/subject/hrsfbxtx.html