A/B text 实例(过程)

作者: 王学习ty | 来源:发表于2018-05-23 11:55 被阅读0次

A/B text 实例(过程)
spark初步
Excel | 旋风图
ES6快速删除数组元素
KeyBoard Maestro Typed String Tr
一看就懂得Vue生命周期
Text B总结
微信小程序简介
CSS-文本1-文本溢出效果
【Python爬虫】Python文件操作

A/B 测试项目

实验概述：免费试用筛选器

在本次实验时，课程目前在课程概览页面上有两个选项：“开始免费试用”和“访问课程资料”。如果学生点击“开始免费试用”，他们将被要求输入他们的信用卡信息，然后他们将参加免费试用课程的付费版本。14天后，除非他们先取消，否则将自动收费。如果学生点击“访问课程资料”，他们将能够免费观看视频并参加测验，但他们不会获得辅导支持或经过验证的证书，他们也不会提交最终项目以获得反馈。

在实验中，测试了一个变化，如果学生点击“开始免费试用”，他们被问到他们有多少时间可以投入课程。如果学生每周表示5小时或更长时间，他们将像往常一样通过结帐流程进行。如果他们每周表示少于5小时，则会显示一条消息，指出Udacity课程通常需要更多的时间才能成功完成，并且建议学生可能希望免费访问课程材料。在这一点上，学生可以选择继续参加免费试用，或免费使用访问课程材料。

我们的假设是，这可能会为学生预先设定更明确的预期，从而减少因为时间不够而离开免费试用的失意学生的数量- 这不会显著减少学生继续超过免费试用并最终完成课程的数量。如果这个假设成立，可以改善整体学生体验，并提高教练支持有可能完成课程的学生的能力。

转移单位是一个cookie，但如果学生参加了免费试用，那么他们将从该用户id开始跟踪。相同的用户ID不能参加免费试用两次。对于未注册的用户，即使他们在访问课程概览页面时已登录，他们的用户ID也不会在实验中进行跟踪。

试验设计

指标选择

Number of cookies:That is, number of unique cookies to view the course overview page. (dmin=3000)

Number of user-ids:That is, number of users who enroll in the free trial. (dmin=50)

Number of clicks: That is, number of unique cookies to click the "Start free trial" button (which happens before the free trial screener is trigger). (dmin=240)

Click-through-probability:That is, number of unique cookies to click the "Start free trial" button divided by number of unique cookies to view the course overview page. (dmin=0.01)

Gross conversion: That is, number of user-ids to complete checkout and enroll in the free trial divided by number of unique cookies to click the "Start free trial" button. (dmin= 0.01)

Retention: That is, number of user-ids to remain enrolled past the 14-day boundary (and thus make at least one payment) divided by number of user-ids to complete checkout. (dmin=0.01)

Net conversion: That is, number of user-ids to remain enrolled past the 14-day boundary (and thus make at least one payment) divided by the number of unique cookies to click the "Start free trial" button. (dmin= 0.0075)

列出你将在项目中使用的不变指标和评估指标。

Invariant Metrics：Number of cookies，Number of clicks，Click-through-probability
Evaluation Metrics：Gross conversion，Retention(剔除)，Net conversion

对于每个指标，解释你为什么使用或不使用它作为不变指标或评估指标。此外，说明你期望从评估指标中获得什么样的试验结果。

测量标准偏差

列出你的每个评估指标的标准偏差。

对于每个Evaluation Metrics，计算标准偏差SD。条件当Number of cookies = 5000 pageview时。（使用的不是实验数据，而是基准数据）
根据基准数据，SD=SQRT( P-pool*(1-P-pool)/N )

对于每个评估指标，说明你是否认为分析估计与经验变异是类似还是不同（如果不同，在时间允许的情况下将有必要进行经验估计）。简要说明每个情况的理由。

规模

样本数量和功效

说明你是否会在分析阶段使用Bonferroni校正，并给出实验正确设计所需的页面浏览量。
利用样本计算器，根据给定的α = 0.05，β=0.2，dmin，BCR(基准数据)，算得是unit of analysis中分母的数量，eg.( net conversion, BCR=0.1093, dmin=0.01）
no use of Bonferroni Correction, because the three evaluation metrics are likely covariant.
得出 27411，需要除以点击概率0.08再乘以2 总样本数685275。由于Retention中unit of dividend跟 unit of analysis 不一致，sd异常大于另外两个指标，导致所需pageview过高在计算duration时会出现duration太长不适合实验，因此剔除此指标。总样本数为满足所有指标中最大的需求

持续时间和暴光比例

说明你会将多少百分比的页面流量转入此试验，以及鉴于此条件，你需要多少天来运行试验。

说明你选择所转移流量部分的原因。你认为此试验对优达学城来说有多大风险？

因为此项实验风险很低，fraction of traffic exposed = 1，duration = 685275/ 40000(pre day)≈18取整

试验分析

合理性检查（Sanity Check）

对于每个不变指标，对你在95%置信区间下期望观察到的值、实际观察的值及指标是否通过合理性检查给出结论。
此处用到实验数据，每列的含义是：
综合浏览量：当天查看课程概览页面的唯一Cookie数量。
点击次数：当天点击课程概览页面的唯一Cookie数量。
注册：当天免费试用中注册的用户ID数量。
付款：在当天注册的用户ID的数量，以保持注册14天，从而进行付款。（请注意，此栏的日期是开始日期，即注册日期，而不是付款日期，付款在14天后发生，因此，注册和付款的跟踪时间缩短了14天比其他栏。）

实验中不变指标是否合理，对于Number of cookies，Number of clicks，对照组实验组随机分布，满足P=0.5，可以用SD=SQRT( P*(1-P) / (Ncon + Nexp)), Margin of error =SD*Z(1.96), P就是CI的中心，加减M得出CI边界，再计算Pcon观察是否在CI中。

对于Click-through-probability，计算Ppool, SD=SQRT( Ppool*(1-Ppool) / (1/Ncon + 1/Nexp)), CI中心是diff=0，观察实际diff是否在CI中。

对于任何未通过的合理性检查，根据每日数据解释你觉得最有可能的原因。在所有合理性检查通过前，不要开始其他分析工作。

结果分析

效应大小检验

对于每个评估指标，对试验和对照组之间的差异给出 95% 置信区间。说明每个指标是否具有统计和实际显著性。只计算Oct.11 - Nov 2的数据。
合并计算。Gross Conversion
Pooled Probability = ([Total Enrolments Control] + [Total Enrolments Experiment]) / [Total Clicks Control + Total Click Experiment]) = 0.2086
Pooled SE = Square root of: [Pooled Probability] * (1 - [Pooled Probability]) * (1 / [Total Clicks Control] + 1 / [Total Clicks Experiment])) = 0.0044
Control Gross Conversion = 0.218874689
Experiment Gross Conversion = 0.198319815
Margin of error = [Pooled SE] * 1.96 = 0.0086
D hat = -0.02055
Lower CI Bound: [D Hat] - [Margin of Error] = -0.0291
Upper CI Bound: [D Hat] + [Margin of Error] = -0.0120
Statistic Significance, Practical Significance

Net Conversion, [-0.0116, 0.0019], No Statistic Significance, No Practical Significance

符号检验

对于每个评估指标，使用每日数据进行符号检验，然后报告符号检验的 p 值以及结果是否具有统计显著性。

网络计算器，P =0.5，because we assume there's no difference.
Gross, success-4, total-23, P-value=0.0026, two-tail Statistic Significance
Net, success-10, total-23, P-value=0.6776, two-tail No Statistic Significance

汇总

说明你是否使用了Bonferroni 校正，并解释原因。若效应大小假设检验和符号检验之间存在任何差异，描述差异并说明你认为导致差异的原因是什么。

No use of Bonferroni correction, since two metics have correlation, use Bonferroni will be too conservative.
Result same with Effect Size Test.

建议

后续试验

对你会开展的后续试验进行概括说明，你的假设会是什么，你将测量哪些指标，你的转移单位将是什么，以及做出这些选择的理由。

网友评论

本文标题：A/B text 实例(过程)

本文链接：https://www.haomeiwen.com/subject/jzfhjftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

A/B text 实例(过程)

A/B 测试项目

实验概述：免费试用筛选器

试验设计

指标选择

测量标准偏差

列出你的每个评估指标的标准偏差。

规模

样本数量和功效

持续时间和暴光比例

试验分析

合理性检查（Sanity Check）

结果分析

效应大小检验

符号检验

汇总

建议

后续试验

相关文章

A/B text 实例(过程)

spark初步

Excel | 旋风图

ES6快速删除数组元素

KeyBoard Maestro Typed String Tr

一看就懂得Vue生命周期

Text B总结

微信小程序简介

CSS-文本1-文本溢出效果

【Python爬虫】Python文件操作

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读