辛普森悖论(Simpson Paradox)定义:
辛普森悖论为英国统计学家E.H.辛普森(E.H.Simpson)于1951年提出的悖论,即在某个条件下的两组数据,分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。
例子说明
- 比赛100场球赛以总胜率评价好坏。取巧的人专找高手挑战20场而胜1场,另外80场找平手挑战而胜40场,结果胜率41%;认真的人则专挑高手挑战80场而胜8场,而剩下20场平手打个全胜,结果胜率为28%,比41%小很多。但仔细观察挑战对象,后者明显更有实力
2.详见 数据分析必须警惕的坑:辛普森悖论 中的IOS/Andrioid设备的转化率
其他
- A/B Test 实验时需注意
避免方法
- 样本选取要随机、均衡
- 加权重参数计算各项的总和
网友评论