美文网首页
ab实验与Delta方法

ab实验与Delta方法

作者: 老姚记事本 | 来源:发表于2021-01-15 19:15 被阅读0次

背景

互联网实验一般使用基于正态分布模型的检验方法,但是在ab实验中我们可能遇到这样的情况:
1.实验结果分析,实验组均值比对照组均值提升了10%,相对提升的置信区间是多少呢?
2.实验组用户合计点击率为26%,对照组未25%,置信度与置信区间如何计算?

在场景1中,实验组均值、对照组均值是分别服从正态分布的,但是它们的比值会服从正态分布么?标准差怎么计算?
而场景2中,平均浏览数、平均点击数是服从正态分布的,但平均点击率等于平均点击除以平均浏览。我们又陷入了正态分布随机变量除以正态分布随机变量的问题!

Delta method可以帮助我们解决这类问题

Delta method是什么

Delta method说的是当一个随机变量服从正态分布时,经过可导的函数变化后仍然概率趋向正态分布,并且提供了期望、方差的计算公式。

单变量下:
\sqrt{n}[X - \theta] \overset{\nu }{\rightarrow} N(0, \sigma^2),且函数g(x)可导,
\sqrt{n}[g(X) - g(\theta)] \overset{\nu }{\rightarrow} N(0, \sigma^2 * [g’(\theta)]^2)

多变量下:
\sqrt{n}[B - \beta] \overset{\nu }{\rightarrow} N(0, \Sigma),且函数g(x)可导,
\sqrt{n}[h(B) - h(\theta)] \overset{\nu }{\rightarrow} N(0, \Delta h(B)^T * \Sigma * \Delta h(B))
其中\Sigma是多元正态分布的协方差矩阵,\Delta hh函数的梯度向量。

Delta method的个人理解

以下为单变量下的个人理解,不等于严格证明。
泰勒公式:
f(x) = f(a) + \frac{f'(a) }{1!}(x -a)+\frac{f''(a) }{2!}(x -a)^2+...
根据泰勒公式:
g(X) \approx g(\theta) + g'(\theta)(X - \theta)
则:
g(X) - g(\theta) \approx g'(\theta)(X - \theta) \overset{\nu }{\rightarrow} N(0, \sigma^2 * [g’(\theta)]^2)
由于g'(\theta)(X - \theta)服从正态分布,左边也近似服从相同的正态分布,且有接近的均值与方差。

为什么可以解决AB的问题

场景1与场景2都是两个正态分布随机变量做除法运算的问题,设一个为Xn,一个为Yn,则(Xn, Yn)服从二元正态分布:

(X_n, Y_n) \sim N((\mu_x,\mu_y), \Sigma)

我们对Xn,Yn的操作等于函数h((x, y)) = y/x ,根据Delta方法:

\frac{Yn}{Xn} \overset{\nu }{\rightarrow} N(\frac{ E[Yn] }{ E[Xn] }, \Delta h( (X_n, Y_n))^T * \Sigma * \Delta h( (X_n, Y_n)))

其中\Delta h((x, y)) = [-\frac{ y}{x^2}, \frac{1}{x}]^T\Sigma = \begin{bmatrix} {\sigma(X_n)^2 }&{cov(X_n, Y_n)}\\ {cov(X_n, Y_n)}&{\sigma(Y_n)^2}\\ \end{bmatrix}

联系背景问题

于是我们可以对两个问题的解决方案:
场景1:X_n对照组均值,Y_n为实验组均值,使用样本均值、样本方差做期望、方差的点估计;
场景2:X_n为平均用户页面浏览次数,Y_n为平均用户页面点击次数,同样使用样本均值、样本方差做期望、方差的点估计。

总结

Delta方法对实验分析至关重要,已经几乎成为所有AB实验平台的一部分,主要用来解决随机化单位与分析单位不同的问题。Delta方法还可以扩展到更高维度,如微软的CUPED论文中通过四元正态分布的Delta方法解决比例型指标的CUPED计算难点。

相关文章

  • ab实验与Delta方法

    背景 互联网实验一般使用基于正态分布模型的检验方法,但是在ab实验中我们可能遇到这样的情况:1.实验结果分析,实验...

  • Spring AOP 生产落地方式有哪些? 面向切面编程

    基于 Spring AOP 实现的 通用实验组件 AB实验/AB测试:https://www.jianshu.co...

  • 12-Regularization

    在VC理论中, 仅仅考虑了Eout < Ein + \delta, 其中\delta 与growth functi...

  • AB测试

    灰度实验是AB实验的一个特例,不是一个标准的AB测 (1)不冲突原则,避免多个实验同时在一个地域上线,防止多个实验...

  • AB实验概念

    1 什么是A/B测试? A/B测试是一种流行的网页优化方法,可以用于增加转化率注册率等网页指标。简单来说,就是为同...

  • 基于 SpringBoot AOP实现的 通用实验组件 AB实验

    什么是AB实验 AB Test 实验一般有 2 个目的: 判断哪个更好:例如,有 2 个 UI 设计,究竟是 A ...

  • 荟萃分析简介

    进行线上ab实验时,为了确认结果可信,用户常常会复验前一阶段的实验。此时经常遇到复验与原实验结果不完全统一,如何综...

  • 科研汪的日常 07 引物设计

    最近一直在跑PCR,利用2(-Delta Delta C(T))次方的方法对目的基因进行相对定量,来比较野生型和基...

  • 02 Delta Method

    本章提要 Delta Method 高阶Delta Method Delta Method 如果我们知道一个统计量...

  • 第二周

    总资产 Asset = 81477 + 70521 = 151987 Delta = -696Cul_Delta ...

网友评论

      本文标题:ab实验与Delta方法

      本文链接:https://www.haomeiwen.com/subject/agdvaktx.html