美文网首页威威专辑
基于博弈论和决策树的监管者、消费者和商家利益均衡分析

基于博弈论和决策树的监管者、消费者和商家利益均衡分析

作者: 威威专栏 | 来源:发表于2017-02-04 14:57 被阅读17次

    大家可能听说过一个故事,一位美国老太太在麦当劳被烫伤,法院判决麦当劳赔偿2200万人民币。看似一件小事,其实背后有着很深刻的道理。 首先对于麦当劳而言,一个2.7亿美元年营业收入(2015年数据)的的庞然大物,大约300万美元的赔款,可以说九牛一毛。但是从市场监管和消费者保护角度来看,没有足够的惩罚措施,可能消费者下次还是同样的遭遇,甚至待遇更差,因为没有相应的监督措施和整改效果。

    下面我们从另外一个虚拟案例入手,使用纳什均衡的纯策略和混合策略博弈和决策树工具,分析对于消费者保护,对于商家理性利益而言,如何监管和多少罚款额度才能起到一定的作用。

    为了便于分析,我们进行简化处理,假设一家公司只生产和销售一种产品,对于这一种产品的销售,商家可以添加一些增加消费吸引力的添加剂来促进产品销量,而消费者并不知道这种物质是否有添加。

    我们假设如下情况: 如果有添加剂,销量增加,商家利润可以增加到20万,如果不添加,利润只有5万。 如果监管查到有添加剂,会产生罚款,商家利润减去罚款,得到纯利润值2万。 消费者如果使用了有害添加剂,可能会产生疾病和医疗费用,假设会造成100万损失。 如果没有添加剂,则无损失,收益为0.

    根据以上假设,我们做出如下纳什均衡表。 纳什均衡是一种策略组合,使得同一时间内每个参与人的策略是对其他参与人策略的最优反应。 假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益,即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的,则此策略组合被称为纳什均衡。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡,从实质上说,是一种非合作博弈状态。

    从以上情况分析出,如果添加有害物之后,监管查到,商家的罚款较少,纯利润大于5万的情况下,商家理性选择,优先选择添加有害物。 如果罚款力度足够大,使得纯利润小于5万,则商家会理性选择不添加有害物。 小结论:罚款应大于添加有害物的利润减去不添加有害物的利润。即大于有害物的边际利润,才能使得商家倾向于选择不添加有害物。

    现实生活中,可能还会有商家依据经验或主观评估监管抽查频率和概率的情况,在这种情况下,我们进一步分析存在概率的博弈和商家决策: 在完全信息博弈中,如果在每个给定信息下只以某种概率选择不同策略,称为混合策略(mixed strategy)。混合策略是纯策略在空间上的概率分布。

    根据如上数据,我们做出如下决策树,即如果商家期望收益和监管抽查概率有关,抽查概率过低,商家更倾向于选择添加有害物,监管无法达到应有的震慑作用。

    情况1:20%抽查概率下的选择:商家选择添加有害物。 情况2:100%抽查情况下的选择:商家选择不添加有害物。

    基于以上初步分析,我们建立消费者-商家-监管利益均衡模型,这里假设监管者只代表消费者利益。 首先,建立混合策略博弈矩阵:

    根据决策树,得出商家期望函数=MAX((Pa+(1-P)e),(Pb+(1-P)f))

    即为了让商家不添加有害物,需要使得Pa+(1-P)eb+(1-P)f 代入假设b=f,改为Pa+(1-P)e<1 即a和e的关系:a<(1-(1-P)e)/P,a=实际盈利-罚款,才能起到震慑作用。

    此处: (实际盈利:事前监管:0;事中监管:已盈利=销售比例系数*e;事后监管:e)

    我们做几轮假设,e=20,000, P抽查概率分别为20%,40%,60%,80%

    事前监管->罚款1 事中监管50%售出->罚款2 事后监管->罚款3

    可以从上面案例得出如下假设: 1. 事后监管的罚款力度要大于事中监管,事中监管的罚款力度要大于事前监管。即监管越靠前端,罚款的效果越显著。 2. 商家预测的监管频率越低,那么罚款力度要越高才能达到震慑效果。反之,监管频率越高,小的罚款力度也能起到更大的作用。

    综上简化分析,我们得出结论,罚款的额度与震慑效果和监管前置、后置有直接关系,和监管频率和概率有一定直接关系。

    对于现实中的监管政策和执行而言,还会有监管成本,执法成本等其他限制条件,这里不做深入讨论。

    相关文章

      网友评论

        本文标题:基于博弈论和决策树的监管者、消费者和商家利益均衡分析

        本文链接:https://www.haomeiwen.com/subject/qynjittx.html