美文网首页
博弈论概念

博弈论概念

作者: HUZZAR | 来源:发表于2024-05-05 11:09 被阅读0次

    合作博弈:团体合作 团体理性

    非合作博弈:个人最优决策

    静态博弈:同时进行 石头剪子布

    动态博弈:先后顺序 后者可以知道前者的动作 下棋

    完全信息博弈:在博弈之前每个人都被告知规则 但参与者不知道对方的选择 囚徒困境

    非完全信息博弈:参与者不了解对方的成本和风险 汽车保险

    完美信息博弈:参与者获得规则 以及对手策略 下棋

    非完美信息博弈:同时做出策略 参与者不知道对方的情况 只能考虑各种情况 然后做出最优选择

    囚徒困境:二人 非合作 静态 完全信息博弈

    当每个人追求最大利益时 社会才会达到它的最大利益?下面的例子证伪

    A:同时承认 每个人判20年

    B:一人承认并且指认另一人的罪行 另一人保持沉默抗拒承认 承认者判5年 沉默者判30年

    C:都拒不承认 两个判10年

    存在结果:

                      合作              背叛            (对手)      

    合作        10/10             30/5

    背叛         5/30              20/20

    选择合作:可能10年 可能30年

    选择背叛:可能5年 可能20年

    对个体来说 背叛是最优解 当两个人都选择最优解 结果是各判20年总体40年 而团体的最优解是各判10年总体20年 由此反证当每个人追求最大利益时 社会不一定会达到它的最大利益

    美苏争霸的囚徒困境:美国和苏联选择合作 同时削减核武器开支对两方是最好的选择 但是由于不确定对方的选择 美苏同时选择背叛 继续投入很多经费研究核武器 最后导致苏联解体

    反复博弈:硬币匹配

    二人 非合作 静态 完全信息博弈

                    合作              背叛        (对手)      

    合作        3/3                 0/5

    背叛        5/0                 1/1

    多次选择,得分制

    一方全背叛 一方全合作: 100:0

    双方都背叛:20:20

    双方都合作:60:60

    一方随机 一方全背叛:8:68

    策略:一开始选择合作 当对方出现背叛 你的选择基于上一次对方的选择 进行道德惩罚 如果对方接受刺激 重新回归合作 这是最好的结果 如果对方继续背叛 你选择继续惩罚ta 但是如果对手的选择是随机性的 则该策略会大打折扣

    纳什均衡:每个人的策略都是对其他人策略的最优反应

                     合作              背叛         (对手)      

    合作        10/10             30/5

    背叛         5/30              20/20

    当对手选择合作的时候 你的最优解是背叛    5<10

    当对手选择背叛的时候 你的最优解还是背叛  20<30

    卢梭:《论人类不平等的起源和基础》中的猎鹿博弈

    两个猎人 获取鹿和兔子给的分值规则如下

                     🦌                   🐰

    🦌            2/2                   0/1

    🐰            1/0                   1/1

    如果只有一个纳什均衡点 那么结果几乎可以预测

    纳什均衡点指的是在一个博弈中,各参与者所选择的策略组合,使得每个参与者都没有动机单独改变自己的策略,考虑到其他参与者的选择。

    在一个博弈中,如果每个参与者都采取了最优的策略,考虑到其他参与者的策略,那么这个策略组合就是一个纳什均衡点。在纳什均衡点上,没有参与者可以通过单独改变自己的策略来获得更好的结果。

    多人博弈:

    A B C三人, 每人选择数字 加合<=10 则每个人得到他们选择数字的分值 如果最后加合>10 什么也得不到

    example1: A/3 B/3 C/2 ,则各获得3/3/2分

    example2: A/5 B/6 C/5,则都没有分数

                      A        B       C      假设ABC都是稳健型选手

    round1      1        1       1

    round2       2       2       2

    round3       3       3       3

    round4       3       4       4    超10🙅  

    round5       3     3/4    4/3

                      A        B       C      假设AB都是稳健型选手 C是大胆型选手

    round1      1        1       6

    round2       2       1       6

    round3       2       2       6

    round4       3       2       6    超10 🙅 AB重回小值 不然什么都得不到

    round5       2       2       6

                       A        B       C      假设AB都是稳健型选手 但是A崇尚平等 C是大胆型选手

    round1      1        1       6

    round2       6       1       6    超10 🙅 A和C开始博弈

    round3       3       2       4

    round4       3       3       4    

    任何加合等于10的策略组合都是纳什均衡点 多人博弈情况复杂不容易达到纳什均衡 站在对方角度考虑问题 能更快达到均衡点

    多选择博弈(中位数原理)

    假设社区选举 从极左到极右分为1-10 10个等级 每个等级有10张选票会投给思想相近的人 如果相邻则两人平分选票

    1      2      3      4      5     6     7     8     9    10

    极左          <           中立           >               极右

    case1 2个候选人思想相近  选票平分

    case2 2个候选人有不同的思想 则有90种不同选择 

    A选择1 则B有9种选择 A一共有10种选择 所以是9 x10 = 90种组合

    假设A选择1 B选择2 则选票结果是10:90 2距离2-10比1距离3-10近 选票会投给思想更接近的人 以此类推 

    A1B2 > 10:90  A1B3 > 15:85  A1B4 > 20:80 ......A1B10 > 50:50 得出只要A选择1 则B最差也是打个平局 所以不能选1或者10边缘选项 同理2和9也不是好的选择 继续排除2和9 3和8 4和7都不是好选择 最后只剩5和6

    1960年美国总统选举 肯尼迪和尼克松都采取中位数原理 结果选票得票率分别为49.7%和49.6% 

    上面是非常理想的模型 每个等级都是10张选票 但是现实是选票分布是不均等的 

    知己知彼 百战不殆 知道对方的想法 才能做出自己的最优选择 同时最优秀的参与者不但知道对方的分析方法 甚至你还要知道对方对你的了解程度

    声誉激励和伪装

    兵者 诡道也 故能而示之不能 用而示之不用 近而示之远 远而示之近

    汽车修理厂 50%大修 50%小修 

    技术差的修理工直接大修 利润较高

    技术好的修理工根据情况进行大小修

    车主怎么才能判断好的和差的修理工? 查看修理记录 总是大修的来判断好坏 但是坏修理工知道后会进行伪装 尽量减少大修 增加小修 偏离了真实的修车需求 

    海盗分脏中的三权分立思想

    海岛分脏:假设5个海盗分脏 100斤黄金 分法:编号1-5 当1号海盗分时 剩下海盗表决如果达到一半的人同意 则按照1号的分法分脏 否则就把1号海盗扔进海里 然后以此类推 可能的结果

    规则制定的权力与规则实施权力的分离 立法权 司法权 行政权

    智猪博弈:2只猪 大猪和小猪 有个杠杆一头食物 推动石头砸动杠杆将食物提升到猪面前 大小猪都可以推石头 

    A假设小猪推石头 大猪在旁边等待 则大猪能吃9份食物 而小猪只能吃1份食物 

    B假设两只猪一起推石头 则大猪能吃7份 而小猪吃3份

    C假设大猪推石头 小猪在旁边等待 则小猪能吃4份 而大猪只能吃6份

    前提:单独推石头会分别消耗2份食物能量 如果一起推分别消耗1份食物能量

                       YES                     NO         (小猪/YES表示推,NO表示不推)

    YES          7-1:3-1              6-2:4

    NO             9:1-2                   0:0

    无论大猪怎么选 小猪选择不推都是最优解 小猪不推的情况下 所以大猪一定会去推 

    充分说明小资产阶级和大资产阶级在一个经济体中的关系

    搭便车:许多中小型企业不会进行大规模的技术创新,而是采取跟随策略,等待大企业的新产品形成新的市场后,仿制大企业的新产品展开销售

    责任与分工:大企业要有大企业的思维 小企业有小企业的策略 大企业承担更多责任

    三个火枪手的博弈 弱弱联合胜过强者

    在Y字形路口三个火枪手相遇 每个人都想射死对方 但是每个人的射中率是不同的 分别为:

    A:70%      B:60%      C:50%

    假设同时开枪:A会射B 因为B对他的威胁最大 B会射A 因为A对他的威胁最大 C会射A A对他的威胁最大 在这种情况下 BC形成合力去射杀A 从死亡概率上来看 A为1-0.4x0.5 = 0.8 B为0.7 C为0 所以虽然射中率排行为ABC 但是A是最有可能死亡的

    任何博弈中 你需要知道对方的水平(理性非理性或者其他)去猜测对方有可能做出的决策 同时也要知道对方对于你的了解程度

    在博弈中 弱小的那方可以拉拢同样弱小的那方以增加赢率

    在博弈中 弱小的那方趋向于消极选择 损失小

    相关文章

      网友评论

          本文标题:博弈论概念

          本文链接:https://www.haomeiwen.com/subject/cfkkfjtx.html