美文网首页博弈论干货有意思的文章
课堂讨论博弈论问题(一):石头剪子布

课堂讨论博弈论问题(一):石头剪子布

作者: Secant | 来源:发表于2014-11-09 21:05 被阅读2899次
    • “石头、剪子、布”(或者“老虎、鸡、杠子”)是一个很多人都玩过的游戏,如果我们两个人一起来玩这个游戏,赌注是人民币100元,并且事先我就告诉你:我接下去会出“石头”!请问:你会出什么?其实,我这里真正要问的是:你接下去要出的内容和我事先告诉你要出“石头”是否有关?
    • 请进一步分析,“言语”是否能够在利益对立的博弈中起作用?为什么?
    • 从课后许多同学的测试结果看,对方出剪子的比例往往是最小的,而出石头的比例是最大的,请构建相应的博弈模型,以便解释该现象。
    • 如果您是那个说要出“石头”的人,请问你实际上会出什么?为什么?
    • 从后续的高级版游戏结果看(当赔率是1:2:5时),出石头总是输的,出剪子总是赢的,为什么会这样呢?原因何在?
    • 以上的游戏结果还对你有哪些方面的启发?请对游戏结果发表你的思考与分析。<br />
    1. “石头、剪子、布”(或者“老虎、鸡、杠子”)是一个很多人都玩过的游戏,如果我们两个人一起来玩这个游戏,赌注是人民币100元,并且事先我就告诉你:我接下去会出“石头”!请问:你会出什么?其实,我这里真正要问的是:你接下去要出的内容和我事先告诉你要出“石头”是否有关?

    我会出剪子。我认为我接下去要出的内容和老师事先告诉我要出“石头”有关。

    2. 请进一步分析,“言语”是否能够在利益对立的博弈中起作用?为什么?

    “言语”可以在利益对立的博弈中起作用,但是起作用是有一定要求的。下面那我来阐述原因。

    首先我们要清楚这是一个利益对立的博弈,因此作为具有理性的博弈双方,对自己的游戏(Game)策略保密无疑是双方实现利益最大化的最保险的一项举措。因此,当双方都缄默时,此时进行的博弈就是一个完全理论上的双方进行猜拳的最简单的模型,每一个人出石头、剪刀、布的概率都分别是1/3,而胜出的概率也是双方各1/3(考虑到平局的情况,当然这具体还要看关于赌注的游戏的规则)。

    然而,正像我刚才所说,双方对策略保密是实现利益最大化的最保险举措,而并不一定是最优举措。如果我们可以通过“言语”这一形式达到制定一个选择策略的锚点,我们就有机会获得不止1/3的胜算。
    但是这一想法能够成功达到效果是需要有一个事先条件的,即,你可以大致判断对方的心理活动或者更贴切的说是认知、推理范围。简单的来说就是对方会想几步。因为石头剪刀布是一个循环的过程,没有一个最优手势也没有一个最劣手势,所以判断对方的推理范围是至关重要的。

    针对本次游戏而言,若出题者为老师,那么老师一定在之前多次进行过这样的博弈,所以掌握了大量的样本数据,老师可以根据这些数据确定一个一般样本的认知、推理范围。有了这个事先条件,加上博弈双方是理性的并追求利益的个体这一设定,我们有理由认为老师会通过 “言语”这一方式来采取策略战胜我们。具体的方法是:老师首先透露一个信息(此处即为“石头”),然后通过掌握的对方的推理范围(一般人会认为对方的信息是假的因此要多想一步,即不能出布而是要出能战胜剪子的石头。这一点通过题干中的信息也可以获得),计算出自己要出的手势(既然对方会多想一步,我就要再多想一步,俗话说要高人一筹),所以会出布制胜。

    因此,“言语”能够在利益对立的博弈中起作用,这个“言语”给出了一个推理的锚点,老师正是根据这个点再加上对对方心理的推测,才确定了自己的制胜策略。

    然而这并非意味着“言语”只能被老师利用,我们一样可以用这一信息提高我们的胜出机率。

    如果老师是与多人同时进行此游戏,那么必定无法采用一个击败所有人的策略,所以理性的老师必定会选择能赢大部分人的策略,即通过上文所说的“一般人的推理范围(这个老师由之前的统计数据可以获得,同时我们也可以合理推测)”来制定策略。然而对于我们来说,这个游戏只进行一次,所以我们只关心我们这一次的输赢,即对于我们来说,博弈的对方只是一个人。考虑到这一点,再加上我们对于一般人推理范围的合理推断,我们一样可以通过老师的“言语”制胜。具体方法是:首先老师透露了一个信息,然后我们合理推断出一般人会采取的策略(即一般人会出石头),之后老师出于要战胜大部分人的目的必定会比一般人多想一步(即出布),作为少数人的我们,即可以比老师再多想一步(即出剪子),从而制胜。“言语”在这里的作用依然是给一个锚点,重要的是我们可以通过分析合理推断对方的推理范围,然后根据“高人一筹”的原则制胜。这一情况很像赌场,赌场会时不时有赚大钱的人,但是只要大部分人都在赔钱,赌场老板就会赚钱,因为他在意的不是那个别几个赚大钱的人,而赚大钱的人也不在意老板是不是一直在赚着钱。

    当老师不是与多人同时进行这个游戏的时候,那么博弈论的双方是处在同一地位上的,我们都只玩一次,而且我们都想赢对方。在这种情况下,如果我们仍有敏锐的判断能力,我们仍有可能增大我们的取胜机会。比如可以判断对方对话语的易信程度、对方的诚实程度、对方有多理性或者对方是否是一个有经验的人,同时还可以考虑到其他方面,比如赌注对于对方的意义,会激发多大程度的好胜心等。然而这一情况与上一情况比起来,因为推断的依据在减少,许多信息我们根本无法揣测出来,所以“言语”所起的作为锚点的作用在减少。但是言语仍然可以作为一个迷惑对方心理的手段达到扰乱对方思考的目的。从这个意义上来说,言语起到了一定的作用

    当我们实在无法判断对方的各种信息或者合理推测时,言语的作用就已经消失了,因为锚点存在但我们无法推测对方的推理范围,此时进行推断的不确定性已经使为获取更大利益所冒的风险大于随机进行出拳了。

    3. 从课后许多同学的测试结果看,对方出剪子的比例往往是最小的,而出石头的比例是最大的,请构建相应的博弈模型,以便解释该现象。

    正像前文所说:理性的大多数人会认为老师为了赢钱所透露的消息必定是假消息,目的是赢自己的钱,因此学生想如果我没猜中老师那么我会出布,如果老师此时出剪子赢我,那我必须比老师多想一步,因此出石头。因为同学认为如果对方已经说明要出“石头”,而自己却出剪刀会看起来更像是一种非理性行为,俗话说直接往枪口上撞,所以只有很少一部分人选择出剪刀。然而大家忽略的是,此时出剪刀同学并不是通过老师“石头”这个信息直接选择出要被石头战胜的“剪刀”,而是通过“石头”这个信息通过推断选择出战胜老师实际会出的“布”的“剪刀”。

    4. 如果您是那个说要出“石头”的人,请问你实际上会出什么?为什么?

    如果我是说要出“石头”的人,我会根据对象来制定自己的策略。一般来说,如果是和大批人进行此博弈,我仍然会选择出布,因为我只要战胜大部分人就赢了,并不在意少部分出“剪刀”的人赢我的钱。如果是单独进行单次博弈,我需要判断对方的推理范围以选择方法,或者在无法判断的情况下随机出。根据对方的变化来选择自己的变化,这才是真正的策略。

    5. 从后续的高级版游戏结果看(当赔率是1:2:5时),出石头总是输的,出剪子总是赢的,为什么会这样呢?原因何在?

    首先解释一下赔率问题,上述1:2:5的赔率意味着:当石头赢剪子时剪子给石头1;当剪子赢布时,布给剪子2;当布赢石头时,石头给布5。

    | 石头 | 剪子 | 布 |
    :----:|:-------:|:------:|:-------:
    石头 | (0, 0) | (1, -1) | (-5, 5)
    剪子 | (-1, 1) | (0, 0) |(2, -2)
    | (5, -5) | (-2, 2)| (0, 0)

    我们假设出石头的有x个人,出剪子的有mx个人,出布的有nx个人,那么我们可以分别算出来各自的收益( s, j, b分别代表石头、剪子、布):





    学生最直观能观察到的收益并非上式所写,而是默认m=n=1的情况下根据表格直接进行简单的加法所算得的收益,即分别是:





    所以学生最直观的感受是,出布会赢得很多,出石头会赢得很少(或者亏得很多),然后学生才会进一步考虑如果人数不是平均分配的问题。当然出布一次赢得很多,但是由于出石头的一次性收益最低甚至亏损,那么学生会想到,出石头的人就会很少,当出石头的人数低至出剪子的人数的2/5时(即m=5/2),出布就没有获利了,所以考虑到这一点,出布不一定会赢得最多。但毕竟出布一次性获利最多,仍会有很大一部分人选择出布。

    我们再来看出剪子的人,上面已经分析过,出布的人数几乎是可以保证一直保持在一个不低的水平的(因为一次性获利大很有诱惑力),又由于出石头一次性亏损很多,所以n是大于1的,甚至在很多情况下是远大于1的,我们结合上面考虑到人数问题算得的收益,可以看到,(2n-1)几乎是一直维持在一个大于1甚至远大于1的值的。所以这就解释了,为什么出剪子的人总是赢。

    最后我们看出石头的人,由于出剪子的人和出布的人数并没有理由拉开一个5:1的如此大的或者更大的距离(即m=5n),最多会拉开到2:1或者3:1。因此,(m-5n)几乎始终是负值,所以出石头的人几乎盘盘皆输。


    • 谢谢大家的阅读,文章若有疏漏和错误之处欢迎指出并加以讨论;
    • 欢迎关注“干货”专题,并将有实用价值的文章投至该专题让大家共享;
    • 如需转载,请注明文章出处与作者——Secant。

    相关文章

      网友评论

      • 上帝遗弃之仔:楼主别管他们,写的真心棒,看的我一愣一愣的
      • b29eec82d70c:略不赞同。这是根据班上同学的具体情况作出的推理——或者说,先有结论再找论据。这更像统计归纳而不是博弈论。比如根据对方的了解,或者对同学这个群体概率性的统计,来估计对方推理的步数,进而决策。这只是普通的决策方法了。
        其实在(2)和(3)的分析里,你已经说到了这个问题的关键——理性人不一定要寻找数学最优。但是“最保险”这个词似乎又有点不准确。可以引入“心理效用”这个概念。所谓“往枪口上撞”会导致心情很差(被鄙视?惋惜情绪等);而如果你出别的,输了,那就是单纯的运气不好了。加入这个概念再放入博弈论的框架看看?不需要完全抛弃博弈论的框架
        同样(5)的分析也是有限步决策的分析方法。纳什均衡即是了。
      • Secant:@枫月柒 我会加油练我的表达能力的,谢谢鼓励~
      • 1b8598816357:看的不是很明白,但是也有些收获
      • Secant:@嫩Dove好吃 我的语言表达能力很差 :sweat:,所以也要多多写多多练呐~
      • 嫩Dove好吃:看不懂

      本文标题:课堂讨论博弈论问题(一):石头剪子布

      本文链接:https://www.haomeiwen.com/subject/eiibtttx.html