因果推断推荐系统工具箱 - DSC（一）

作者: processor4d | 来源:发表于2021-12-16 22:50 被阅读0次

文章名称

【AAAI-2019】【Renmin University/Alibaba Group】Debiasing Career Recommendations with Neural Fair Collaborative Filtering

核心要点

文章旨在研究领域偏差是如何影响跨领域推荐的，并在此基础上提出了针对跨领域推荐的IPS模型以及3种学习propensity score的约束，形成基于因果嵌入向量的跨领域推荐框架，在进行跨领域推荐时，消除领域偏差对用户信息迁移到影响。

方法细节

问题引入

不同领域的用户往往有不同的行为模式[2]或不同的选择偏好[1]，为跨领域迁移用户信息进行推荐带来困难。现有方法主要通过学习可以有效迁移跨域信息的embedding[3, 29, 40]来实现跨领域推荐，包括利用共享参数 [3, 40]，特征映射[2]，语义空间对齐等。尽管这些方法在跨域推荐上效果很好，但它们并没有显示建模用户偏好存在跨域差异的原因。

作者在分析实际业务数据中发现，存在领域相关的混淆变量，影响了用户在特定场景的偏好，进而影响了用户在该场景下的选择，造成选择性偏差。例如，一个用户美妆兴趣的用户，在快销场景（快销APP）中，倾向于选择便宜，优惠力度大，物美价廉的品牌，而在好物推荐（兴趣探索APP）中倾向于关注品质好，吸引人，且相对昂贵的奢侈品牌。

具体做法

作者提出的debiase cross-domain推荐框架主要是利用扩展的IPS模型消除domain-specific confounders（DSC），一言以蔽之，

构建因果图，将影响推荐结果的混淆变量分为2类，domain-specific confounders (DSC) 以及 general confounders (GC)，主要消除DSC对跨领域推荐带来的影响。

扩展IPS模型，并利用3种约束（estimator level, domain level以及individual level）解决跨领域propensity score数据稀疏造成的估计困难的问题。

作者将跨领域推荐问题定义如下，

$\mathcal{D},\mathcal{U},\mathcal{I}$ 分别表示领域、用户、物品的集合。

$\mathcal{J}$ 是不同领域共享的物品特征的集合，每一个物品的特征包含的特征集合为 $\mathcal{J}_i = \{ j_1,\ldots,j_m \} \subset \mathcal{J}$ （因为不同的物品在不同的领域只包含一部分特征，同样的物品可能只出现在一个领域。不过有点奇怪的是，共享的特征不应该是个自己子集么？）。

$v_u, v_u^d$ 分别表示用户 $u$ 的全局偏好（比如，喜欢美妆）以及领域偏好（例如，在快销APP喜欢打折力度大的物品）。

跨领域推荐的目标是，对给定的用户、物品以及物品特征 $u, i,\mathcal{J}_i$ ，学习通用的用户偏好 $v_u$ 消除 $v_u^d$ 的影响，更好的预测用户的反馈 $y_{ui}$ ，并可以迁移到其他领域。

值得注意的是，作者强调用户是多领域有重合的，而不强制要求物品有较大重合。

因果图

作者定义的因果图，如下图所示，其中 $v_j^d$ 是物品在特定领域的特征表示。可以看出整体的confounder影响了用户在各个领域对物品的评分，而领域特有的confounder只影响某个领域的用户对物品的评分。

Causal Graph

值得注意的是，除了领域特有的confounder以外，作者并没有假设整体confounder会影响用户的偏好，而是假设领域偏好是受整体偏好和领域confounder共同影响。

本节介绍了作者要解决的跨领域推荐的背景，解决的思路以及因果图的结构，下一节继续讲解作者提出的IPS模型，以及优化估计的方法。

心得体会

因果图

个人感觉，作者的因果图里还可以再多两个因果关系，即通用的confounder也会影响作者的领域偏好，只不过这个影响可能比较弱，在领域间是可以消除的，或者说抵消的。这样也可以总结成一条因果关系，即 $GC \rightarrow v_u$ 。不过似乎作者认为，这两种都可以省略。

文章引用

[1] Ning Zhou and Jun-Yuan Xie. 2011. Select web services based on qualitative multi-users preferences. Dianzi Xuebao(Acta Electronica Sinica) 39, 4 (2011).

[2] Ali Mamdouh Elkahky, Yang Song, and Xiaodong He. 2015. A multi-view deep learning approach for cross domain user modeling in recommendation systems. In WWW. 278–288.

网友评论

本文标题：因果推断推荐系统工具箱 - DSC（一）

本文链接：https://www.haomeiwen.com/subject/radbfrtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！