问题定义
- 我们常说归因分析,归因分析到底在归什么因?
- 归因分析的常用方法是什么?
- 归因分析能解决什么问题?
归因分类
- 链路归因
投放 => 渠道 => 广告页 => 落地页 => 注册 => 转化
方法:时间衰减、马尔可夫链、最终互动等 - 指标维度归因
多维立方体Cube下,寻找影响最大的维度组合属性
方法:维度搜索、相关维度间影响识别 - 贡献度归因
看到维度属性的影响力
方法:广义加法模型,包括EBM、SHAP值
指标维度归因相关做法
下面介绍几篇论文,论述下指标维度归因的方法。
【Adtributor 算法】
https://blog.csdn.net/Eaton18/article/details/103797563
https://cloud.tencent.com/developer/article/1644348
核心思路:对每个维度,找出真实值和预测值存在巨大差异的几个因素,如果这些因素累加在一其的波动占整体波动很大比例,则认为这几个因素就是造成这次收入波动的根本因素
Adtributor缺点及局限
(1)上述是针对基本类型的KPI的计算公式(例如PV、交易量),对于派生类型的KPI(多个基本类型KPI计算得到,例如成功率)就不太适用了
(2)将根因限定在一维的假设不太符合我们的实际场景,同时用解释性和惊奇性的大小来衡量根因也不完全合理。因为其没有考虑到维度之间的相互影响以及「外部根因」的可能
(3)Adtributor的根因分析严重依赖于整体KPI的变化情况,对于整体变化不大,但是内部波动较为剧烈的数据表现不好
相关论文
Adtributor: Revenue Debugging in Advertising Systems
Recursive Adtributor
主要贡献是循环的使用了Adtributor 来实现
iDice: Problem Identification for Emerging Issues
翻译
主要贡献是寻找effective combination
HotSpot: Anomaly Localization for Additive KPIs with Multi-Dimensional Attributes
翻译
Squeeze:Generic and Robust Localization of Multi-Dimensional Root Causes
Bayesian structure learning algorithm
知乎精答
https://www.zhihu.com/question/331456480/answer/806871325
总结
image.png指标维度归因的步骤:
-
预测指标值
-
异常检测
-
异常定位(涟漪效应假设)
-
搜索减枝问题
-
全局节点价值函数的定义(为了全局排序)
-
网友评论