文章名称
【RecSys-2021】【University of Louisville】Debiased Explainable Pairwise Ranking from Implicit Feedback
核心要点
文章旨在通过构造新的BPR损失,赋予BPR方法的可解释性,并环节Exposure Bias对BPR损失的影响。作者提出了基于矩阵分解的可解释BPR模型EBPR,可以获得在物品级别的可解释性,并且可以根据可解释性量化Exposure Bias。
上一节讲解了BPR方法的问题,以及作者构建EBPR和Explainability Matrix矩阵的思路,这一节继续介绍EBPR中的曝光偏差以及如何进行无偏EBPR学习。
方法细节
问题引入
如许多方法[1]提到的,BPR损失会受到曝光偏差的影响,因为在只有隐式反馈的观测数据时,我们把所有点击的样本当做正样本,其他样本均为负样本。尽管他们中间没有被展示的物品也可能是用户青睐的(在之前许多文章中已经阐述过,如因果推断推荐系统工具箱 - PropDCG(一))。
用分别表示物品被展示给用户的概率,以及用户偏好该物品的概率。交互随机变量(比如点击)只在用户看到该物品(物品被展示了)且用户偏好这个物品时会被记录下来(是相关性的一个子集)。[1]提出采用IPW方法来进行无偏估计,具体的估计公式如下图所示。
Unbiased estimator for the ideal BPR loss如前所述,Explainability Matrix也是依赖且只依赖交互矩阵(随机变量)的,同样会受到偏差影响。理想情况下,Explainability Matrix应该是通过邻域物品集合的相关性计算的到的,计算公式如下图所示。
Ideal explainability matrix由此可以得到理想状态下(完全无偏)的EPBR损失,具体公式如下图所示。
Ideal EBPR loss但我们不知道用户-物品的相关性(虽然可以人工标注相关性,但是耗时好力也可能不准确),因此可以利用如下图所示的,Partially Unbiased Explainable BPR (pUEBPR)损失来近似,显然,这不是我们想要的结果。
具体做法
UNBIASED EBPR ESTIMATOR
好了,废话半天,引出UNBIASED EBPR ESTIMATOR。其实就是对做IPW,具体公式如下图所示。其中,表示物品的近邻物品集合(集合中的一个或多个的概率总体,也不能算是总和,因为不一定互斥),被暴露给用户的概率。
Unbiased EBPR (UEBPR) estimator作者证明了上述公式是Ideal EBPR loss的无偏估计,证明过程如下图示。总体思路就是IPW,无他。
证明过程中最后一步,把拆成,是因为,在给定邻域物品集合时,假设把用户曝光给用户和用户对物品的真实偏好是相互独立的。
Proof of Unbiased EBPR心得体会
Unbiased EBPR
文章亮点主要是结合了item-based可解释性和偏差纠正,但做法和思路其实非常简单。利用最近邻估的交互概率(这个概率可以用统计法统计出来,fancy一点弄个模型),纠偏就用IPW。感觉有一些头重脚轻。
话说最近分享的文章都有点,头重脚轻... 需要改变一下...读点经典的...
文章引用
[1] Yuta Saito. 2019. Unbiased Pairwise Learning from Implicit Feedback. In NeurIPS
2019 Workshop on Causal Machine Learning.
网友评论