美文网首页
AB Test 评估准则

AB Test 评估准则

作者: Lilyabao | 来源:发表于2017-08-03 11:55 被阅读575次

本文记录 AB Test 评估准则,用于指导 AB Test设计

度量选择

标准 符合要求
是否为试验选择了适当的不变量和评估指标? 已为试验选好一组适当的度量,未遗漏任何必要或重要度量。
是否为度量选择提供了合理理由? 每个度量都有清楚合理的理由,解释为何将其选作不变度量及评估度量。
我们希望通过开展此试验得到什么结果? 报告中清楚地说明了我们希望通过开展此试验取得的结果,且所述结果与试验目的一致。

变异性

标准 符合要求
是否正确计算了所有评估度量的标准偏差? 已正确计算所有评估度量的标准偏差。
是否通过推理说明每个分析标准偏差是正确的? 每个评估度量都有清楚正确的解释,说明分析变异性是否可能匹配经验变异性。

规模

标准 符合要求
页面浏览量是否正确考虑了计划的分析? 考虑到学生是否使用 Bonferroni 校正情况下所给的页面浏览量是正确的。
是否基于风险选择了适当的试验暴露水平? 将对试验的风险等级提供理由充分的论点,并将相应选择转移流量的部分。
试验的持续时间是否正确考虑了暴露? 试验的持续时间在考虑到所选转移流量部分后进行了正确计算。

完整性检验

标准 符合要求
是否正确执行了完整性检查? 正确计算了所选的所有不变度量的完整性检查。
是否分析了完整性检查的结果? 评估了完整性检查:通过或未通过。 若未通过完整性检查,通过分析探索了失败原因并中止试验。

效应量检验

标准 符合要求
是否对所有评估度量的差异计算了置信区间? 正确计算了置信区间并报告了所有评估度量的差异。
是否正确评估了统计显著性与实际显著性? 正确报告了所有评估度量的统计显著性与实际显著性。

符号检验

标准 符合要求
是否对每个评估度量报告了符号检验 P 值,并表明符号检验是否具有统计显著性? 对所有评估度量正确报告了 P 值和统计显著性。

结果汇总

标准 符合要求
是否提供了正当理由,说明是否选择使用 Bonferroni 校正? 报告为是否选择使用 Bonferroni 校正提供了合理理由。
是否分析了效应量检验和符号检验之间的所有差异? 为效应量检验和符号检验之间的每项差异提供了充分合理的解释。

建议

标准 符合要求
是否基于试验结果提供了合理建议? 提供了合理并用数据支持的建议。

根进实验

标准 符合要求
是否为所给目的进行了合理的试验,并提出了明确的假设? 开展了值得检验的合理试验,并明确说明了试验结果假设。
是否为提议的试验选择了适当的评估度量,并提供了支持推理? 报告中选择的度量足以用于评估试验的假设,可在大多数基础设施下进行测量,且报告中提供了充足的支持推理。
是否为试验选择了合理的转移单位? 报告中说明了合理的转移单位,并提供了充分的支持理由。

相关文章

  • AB Test 评估准则

    本文记录 AB Test 评估准则,用于指导 AB Test设计 度量选择 变异性 规模 完整性检验 效应量检验 ...

  • test

    test ab

  • 关于产品改版

    AB test

  • ab test

    深度推荐系统与CTR预估2019年上半年值得精读的论文 https://mp.weixin.qq.com/s?__...

  • 2019-05-27我国资产评估准则

    我国资产评估准则 一、我国资产评估准则概述 1.简介 《资产评估法》规定评估机构及其评估专业人员开展业务应当遵守法...

  • Linux ab test

    例子 注意我们在启动ab时,传入3个命令行参数,它们正是代表了前面提到的前提条件:-n1000 表示总请求数位10...

  • 【译文】AB test

    八 AB test (一)定义 又名 split test、bucket test,以提高转化率为目的,用数据结果...

  • AB-TEST

    背景 无法衡量就无法优化,对于互联网产品而言,不仅是推荐系统,整个app系统的更新迭代必然需要建立一套度衡量,来把...

  • 定性调研与定量调研

    AB test(用户量较大的公司) 网站首页和产品页的某按钮转化率特别低,因此考虑用AB test来提高某按钮的转...

  • ab test with json data

    post.json

网友评论

      本文标题:AB Test 评估准则

      本文链接:https://www.haomeiwen.com/subject/qmxplxtx.html