美文网首页
辛普森悖论与人生哲学

辛普森悖论与人生哲学

作者: 数据蝉 | 来源:发表于2020-12-15 00:57 被阅读0次

1.案例在前

假如我们拿到了这样一份转化数据,想要分析哪种系统的设备转化效果更好,该如何分析呢?


image.png

(1)我们来看,按照系统类型和设备类型分类比较的话:


image.png
  • 分析结论:Android设备转化率无论在平板端还是在手机端的转化率都小于iOS设备。
    (2)按照设备类型分类来比较的话:


    image.png
  • 分析结论:当计算全设备情况时,Android的转化比例为550/10000=5.5%,iOS的转化比例只有200/5000=4.0%。iOS版本的设备转化率小于Android设备。

所以问题出在哪里了呢,我们的结论应该是什么呢???


image.png

2.透过现象看本质

2.1 发生原因

误区产生的原因说起来也很简单,就在于将两个维度的数据,归纳成了一个维度的数据,并进行了合并。我们可以看到,基数较大的Android平板把“整体转化率”的数据带偏了。

2.2 引入理论

这个现象就是经典的辛普森悖论:即在某个条件下的两组数据,分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。

2.3 应对策略

避免辛普森悖论的关键是要同时参考不同用户间的事实全貌。

  • 第一,准确的用户分群在数据分析中是非常重要的,尤其是在免费产品当中,平均用户不仅不存在,而且是误导研发的因素之一,所以关键在于利用特征将用户进行合理划分。
  • 第二,在一个具体的产品中,普适型的数据(如粗暴的对比IOS和Android总体情况)是没有多大参考意义的,一定要细分到具体设备、国家、获取渠道、消费能力等等再进行比对才有价值。
  • 第三,斟酌个别分组的权重,以一定的系数去消除以分组资料基数差异所造成的影响,同时必需了解该情境是否存在其他潜在要因而综合考虑。

2.4 场景延申

2.4.1 A/B测试

一个常见的A/B测试误判例子是这样的:拿1%用户跑了一个重大版本,发现试验版本购买率比对照版本高,就说试验版本更好,我们应该发布试验版本。

而事实上,我们选取的试验组里往往会挑选那些乐于交流、热衷产品、又或者是付费率高粘性高的用户,把他们的数据与全体用户对比是不客观的。当最后发布试验版本时,反而可能降低用户体验,甚至造成用户留存和营收数据的双双下降。

2.4.2 质与量不对称

辛普森悖论就像是欲比赛100场篮球以总胜率评价好坏,于是有人专找高手挑战20 场而胜1场,另外80场找平手挑战而胜40场,结果胜率41%,另一人则专挑高手挑战80场而胜8场,而剩下20场平手打个全胜,结果胜率为28%,比 41%小很多,但仔细观察挑战对象,后者明显较有实力。

量与质是不等价的,无奈的是量比质来得容易量测,所以人们总是习惯用量来评定好坏,而此数据却不是重要的。

2.4.3 哲学意义

除了质与量的迷思之外,辛普森悖论的另外一个启示是:
如果我们在人生的抉择上选择了一条比较难走的路,就得要有可能不被赏识的领悟,所以这算是怀才不遇这个成语在统计学上的诠释。

相关文章

  • 辛普森悖论

    辛普森悖论(Simpson Paradox)定义: 辛普森悖论为英国统计学家E.H.辛普森(E.H.Simpson...

  • 辛普森悖论与人生哲学

    1.案例在前 假如我们拿到了这样一份转化数据,想要分析哪种系统的设备转化效果更好,该如何分析呢? (1)我们来看,...

  • 在列联分析中的辛普森悖论

    情景: 在列联分析中有时会出现辛普森悖论,简述什么是辛普森悖论,它产生的原因是什么?如何防范辛普森悖论。 什么是辛...

  • 辛普森悖论

    今天介绍一个挺有意思的东西,有时候,分组调研的结论,会跟整体调研的结论刚好相反,这种现象被称作「辛普森悖论」。 有...

  • 辛普森悖论

    辛普森悖论也叫辛普森佯谬。先解释下佯谬,大概意思就是看起来是错误的,实际却是正确的。 这是个统计学里面的概念,是E...

  • 辛普森悖论

    有一种肾结石病,死亡率很高,并且结石越大的患者(晚期)存活率越低。 玛丽医院迎来一批肾结石患者,其中一半病人采用治...

  • 辛普森悖论

    辛普森悖论 对于存在相关关系的两组因子A、B,可能存在一种现象,A、B为正相关,而将A分组后的A1和A2分别与B成...

  • 辛普森悖论

    https://mp.weixin.qq.com/s/c4fU-ioFVv0fGP1nrAXZsg https:/...

  • 辛普森悖论

    辛普森悖论:依据综合数据和非综合数据得到相反的结论被称为辛普森悖论。 利用交叉分组表分析两个变量之间的关系时,应该...

  • 辛普森悖论

    辛普森悖论(Simpson's Paradox)是统计学里一个很重要的悖论,在实验分析中经常被用到,是一个很反直觉...

网友评论

      本文标题:辛普森悖论与人生哲学

      本文链接:https://www.haomeiwen.com/subject/yzrigktx.html