https://cloud.tencent.com/developer/article/1666552
https://cloud.tencent.com/developer/article/1480301?from=article.detail.1666552
https://cloud.tencent.com/developer/article/1631574?from=article.detail.1666552
JS散度
https://zhuanlan.zhihu.com/p/74075915
https://zhuanlan.zhihu.com/p/35709485
不确定性函数 f(x) = -log p(x) ,概率越小,不确定性越大
交叉墒:用来优化不确定性的,预测 和 实际分布之间的不确定性
【Adtributor 算法】
https://blog.csdn.net/Eaton18/article/details/103797563
https://cloud.tencent.com/developer/article/1644348
核心思路:对每个维度,找出真实值和预测值存在巨大差异的几个因素,如果这些因素累加在一其的波动占整体波动很大比例,则认为这几个因素就是造成这次收入波动的根本因素
Adtributor缺点及局限
(1)上述是针对基本类型的KPI的计算公式(例如PV、交易量),对于派生类型的KPI(多个基本类型KPI计算得到,例如成功率)就不太适用了
(2)将根因限定在一维的假设不太符合我们的实际场景,同时用解释性和惊奇性的大小来衡量根因也不完全合理。因为其没有考虑到维度之间的相互影响以及「外部根因」的可能
(3)Adtributor的根因分析严重依赖于整体KPI的变化情况,对于整体变化不大,但是内部波动较为剧烈的数据表现不好
相关论文
Adtributor: Revenue Debugging in Advertising Systems
Recursive Adtributor
iDice: Problem Identification for Emerging Issues
翻译
主要贡献是寻找effective combination
HotSpot: Anomaly Localization for Additive KPIs with Multi-Dimensional Attributes
翻译
Squeeze:Generic and Robust Localization of Multi-Dimensional Root Causes
Bayesian structure learning algorithm
知乎精答
https://www.zhihu.com/question/331456480/answer/806871325
网友评论