文章名称
【AAAI-2019】【Renmin University/Alibaba Group】Debiasing Career Recommendations with Neural Fair Collaborative Filtering
核心要点
文章旨在研究领域偏差是如何影响跨领域推荐的,并在此基础上提出了针对跨领域推荐的IPS模型以及3种学习propensity score的约束,形成基于因果嵌入向量的跨领域推荐框架,在进行跨领域推荐时,消除领域偏差对用户信息迁移到影响。
方法细节
问题引入
不同领域的用户往往有不同的行为模式[2]或不同的选择偏好[1],为跨领域迁移用户信息进行推荐带来困难。现有方法主要通过学习可以有效迁移跨域信息的embedding[3, 29, 40]来实现跨领域推荐,包括利用共享参数 [3, 40],特征映射[2],语义空间对齐等。尽管这些方法在跨域推荐上效果很好,但它们并没有显示建模用户偏好存在跨域差异的原因。
作者在分析实际业务数据中发现,存在领域相关的混淆变量,影响了用户在特定场景的偏好,进而影响了用户在该场景下的选择,造成选择性偏差。例如,一个用户美妆兴趣的用户,在快销场景(快销APP)中,倾向于选择便宜,优惠力度大,物美价廉的品牌,而在好物推荐(兴趣探索APP)中倾向于关注品质好,吸引人,且相对昂贵的奢侈品牌。
具体做法
作者提出的debiase cross-domain推荐框架主要是利用扩展的IPS模型消除domain-specific confounders(DSC),一言以蔽之,
- 构建因果图,将影响推荐结果的混淆变量分为2类,domain-specific confounders (DSC) 以及 general confounders (GC),主要消除DSC对跨领域推荐带来的影响。
- 扩展IPS模型,并利用3种约束(estimator level, domain level以及individual level)解决跨领域propensity score数据稀疏造成的估计困难的问题。
作者将跨领域推荐问题定义如下,
- 分别表示领域、用户、物品的集合。
- 是不同领域共享的物品特征的集合,每一个物品的特征包含的特征集合为(因为不同的物品在不同的领域只包含一部分特征,同样的物品可能只出现在一个领域。不过有点奇怪的是,共享的特征不应该是个自己子集么?)。
- 分别表示用户的全局偏好(比如,喜欢美妆)以及领域偏好(例如,在快销APP喜欢打折力度大的物品)。
- 跨领域推荐的目标是,对给定的用户、物品以及物品特征,学习通用的用户偏好消除的影响,更好的预测用户的反馈,并可以迁移到其他领域。
值得注意的是,作者强调用户是多领域有重合的,而不强制要求物品有较大重合。
因果图
作者定义的因果图,如下图所示,其中是物品在特定领域的特征表示。可以看出整体的confounder影响了用户在各个领域对物品的评分,而领域特有的confounder只影响某个领域的用户对物品的评分。
值得注意的是,除了领域特有的confounder以外,作者并没有假设整体confounder会影响用户的偏好,而是假设领域偏好是受整体偏好和领域confounder共同影响。
本节介绍了作者要解决的跨领域推荐的背景,解决的思路以及因果图的结构,下一节继续讲解作者提出的IPS模型,以及优化估计的方法。
心得体会
因果图
个人感觉,作者的因果图里还可以再多两个因果关系,即通用的confounder也会影响作者的领域偏好,只不过这个影响可能比较弱,在领域间是可以消除的,或者说抵消的。这样也可以总结成一条因果关系,即。不过似乎作者认为,这两种都可以省略。
文章引用
[1] Ning Zhou and Jun-Yuan Xie. 2011. Select web services based on qualitative multi-users preferences. Dianzi Xuebao(Acta Electronica Sinica) 39, 4 (2011).
[2] Ali Mamdouh Elkahky, Yang Song, and Xiaodong He. 2015. A multi-view deep learning approach for cross domain user modeling in recommendation systems. In WWW. 278–288.
网友评论