A/B测试和“果然一点不相干”

作者: scvhuang | 来源:发表于2017-05-28 15:00 被阅读243次

前言

“果然一点不相干”是张之洞故事里的一个文字游戏,这句话是下联,上联是“树已千寻难纵斧”。树对果,已对然,千寻对一点,纵对相,斧对干,极其工整,但是句子连起来读,上下联一点关系也没有,诚如下联“果然一点不相干”的字面意义。

很显然这个玩法,是基于拆开每个文字的多义匹配,和句子的多义匹配,是两码事。

A/B测试

最近的一个A/B测试,分流的流程里有的页面只是路过,并没有参与改版,这是背景。数据出来以后,拆开每个步骤看,各个位置的新页面有的改好,有的改差,但是好玩的是,一点也没改的页面,转化率也很有大的变化。

句子可以拆成字去分析,但是仍然会作为一个整体去理解,类比A/B测试,如果刻意地把各个步骤的结果堆砌起来,结果有可能会“果然一点不相干”。

为什么对联可以变成文字游戏?关键在于歧义,每个字都有很多意思,干有干戈的意思可以对上斧,但是和相结合起来,就有关联的意思,和纵斧的意思完全千里之遥了。

那么流程页面为什么可以拆开来看呢?其前提是,信息量的输入和输出是不变的,同样是一个没有任何改版的页面,如果他前面一页信息量发生了变化,假设就不成立了。

转移概率

这时候会发现一个好玩的现象是,A页面的改版效果,在数据上体现在A+1页面到A+2页面的转化率变化。当然你可以说对A+3也有影响,用统计学的语言表达,这句话可以写成:

P(Xn+1=x|X0,X1,X2。。。)

就是说某步骤的下一步转移概率,取决于前面几步的条件概率。简化计算(也就是马尔可夫)就是第n步仅由第n-1步决定,这个公式在实际工作里可以用来识别名字/识别翻译/识别员工离职概率等等,而且可以防止“果然一点不相干”,为什么?因为他考虑了n-1(和n-2/n-3。。。如果你算的过来)。

收回思路,recap一下

1、ab测试的原则是分步骤、控制变量找问题。

2、当信息量等参数发生显著变化,分步骤的形式会有瑕疵,需要把发生变化的“下一步”也绑进来成为一个分析体。

3、这就启示我们,ab测试的结果,不仅仅有时间的压缩/弹伸效应(刚上线效果会显著,随时间延续,会平复到显著位和之前位置的中间,冥冥中有一个常量在控制,以前写过一篇blog),还有空间的压缩弹伸效应,也就是有些位置会极大改善,有些位置会变差,冥冥中也有一个常量在控制。

这也可以解释为什么“看起来越容易成功的改版,越容易失败“(抱歉这句伪名言是我自己想出来的),因为人的认知往往会忽视一些不容易察觉到的隐含变量,经过时间空间的来回拉伸以后,最终稳定状态能够有微小改善就很不错了。

4、所以我会得到“ab测试应该更复杂”的结论么?

不。恰恰相反,这更说明ab测试的意义应该更“辅助”。

本来这就是欧美的互联网工程师文化下的小玩意,在国内被妖魔化了,仅仅是辅助,如果完全依赖A/B来做决策,而不结合传统的客户调研,基于经验的感性分析等,则要么是出于政治诉求,要么就是无知无畏,不怕“果然一点不相干”了。

谢谢阅读。

相关文章

  • A/B测试和“果然一点不相干”

    前言 “果然一点不相干”是张之洞故事里的一个文字游戏,这句话是下联,上联是“树已千寻难纵斧”。树对果,已对然,千寻...

  • 《【译】落地页优化系列二:落地页A/B测试》

    本篇主要内容是落地页A/B测试: 1. A/B测试的价值 2. 该测试什么元素? 3. 衡量和运用A/B测试的结论...

  • 机器学习面试题集 - 如何进行 A/B 测试

    什么是 A/B 测试? A/B 测试什么时候用? 如何应用 A/B 测试? 什么是A/B 测试 A/B 测试是最简...

  • MVT(多变量测试)和A/B测试

    相似点:1.这两种方法的测试原理类似,都是通过将网页或APP的流量,拆分并引导到有差异的页面来测试其中的不同2.针...

  • crazyEgg初探

    简述 Crazy Egg是一款网站优化软件,提供A / B测试、热图和可用性测试工具。这款A / B测试工具允许你...

  • 24 | A/B 测试:验证决策效果的利器

    A/B测试,也叫桶测试或分流测试,指的是针对一个变量的两个版本 A 和 B,来测试用户的不同反应,从而判断出哪个版...

  • 2018-12-14 一文搞懂AB Testing的分层分流(转

    在网络分析中,A / B测试(桶测试或分流测试)是一个随机实验,通常有两个辩题,A和B。如果你还对这个测试不是很明...

  • A/B Test

    一、A/B Test是什么? A/B测试是一种帮助的网页优化实验方法。A/B测试的目的在于通过科学的实验设计和采集...

  • A/B测试

    需要进行在线A/B测试的原因如下。 (1)离线评估无法完全消除模型过拟合的影响,因此,得出的离线评估结果无法完全替...

  • 传导抗扰测试

    1、硬件连线 a) 电源测试 b) 信号测试 2、运行软件 3、选择测试文件 a) 电源 b) 信号测试 4、开始...

网友评论

  • 史东:好文,好例,用在基因工程的基因表达翻译上,人工智能的翻译,就是“果然一点不相干” 😄

本文标题:A/B测试和“果然一点不相干”

本文链接:https://www.haomeiwen.com/subject/jjkhfxtx.html