文章名称
【AAAI-2019】【Rutgers University】Causal Collaborative Filtering
核心要点
文章旨在将现有的基于相关性的协同过滤模型,扩展到基于因果的协同过滤模型,使得模型能够打破观测数据的边界,真正的估计那些没有被观测到的反事实结果。作者提出了一个通用的协同过滤框架CCF来建模推荐系统中的因果关系,并且表明原有的基于相关性的协同过滤模型是CCF的特例,是简化CCF因果图之后的结果。作者还提出了一个条件干预方法来模拟do-calculus,以此从观测数据中估计因果关系,并利用新提出的反事实约束学习框架估计用户对物品的偏好。
上一节描述了如何把估计的问题转化为条件期望
,并且强调存在其他的交互历史
的情况,需要进行反事实推理。本节继续介绍,反事实推理和基于反事实约束的学习方法。
方法细节
问题引入
上一节提到估计等价于估计条件期望
。这里的
需要是所有可能的交互,而不仅仅是观测到的实际交互,也就是需要生成反事实
。作者把子图c的因果图改为子图d中的因果图。这样的改动,把随机变量
变为外生变量,其他的随机变量
是链式结构。如果
是全部的可能结构,那么
则是所有可能的被推荐的物品(也就是无偏的,不但推荐的物品的个数可能发生变化,概率也可能发生变化),这样估计的偏好也将是无偏的。

作者把用户偏好的无偏估计公式表示如下,其中表示所有可能的历史交互。此时,我们需要估计在所有可能的历史交互下,物品
被推荐的可能以及其对用户偏好的影响。估计所有可能性的期望值,作为用户偏好的估计值。

具体做法
如前所述,为了实现在所有交互历史的情况下,通过估计推荐特定物品的期望,来估计干预
,需要反事实推理。具体需要经历三个步骤,
- 生成反事实样本。生成的反事实样本一般被要求是在真实样本上进行最小的改动[30],并改变模型的判断。在文章的场景中,要求经过最小改动,使得用户行为历史
变为反事实样本
。
- 筛选反事实样本。因为我们要求被推荐的物品是
(因为
,所以,
得到的
必须和目标的
一致,需要过滤掉不符合条件的反事实样本。
- 计算条件期望。此时,需要知道每一个反事实样本出现的条件概率。然而,这个概率是未知的,因此,作者利用均匀分布(因为不知道任何信息,基于最大熵的原理,就选择均匀分布),平均分配反事实的概率。观测事实的概率大于其他均匀分布的反事实。(作者表示其他分布将来会尝试)。
Generate Counterfactual Examples
生成反事实样本时,作者首先采用启发式的方法,包括3种策略,
- Keep One,K1。在真实的历史行为中,只保留用户的一个交互行为。
- Delete One,D1。从用户真实的历史行为中,删除一个用户的交互行为。
- Replace One,R1。从用户真实的历史行为中,替换一个用户的交互行为。
在R1策略中,又可以分为,随机替换和最近邻替换,其中最近邻的度量embedding的欧氏距离。
Select Counterfactual Examples
假设用户历史行为序列为,利用上述任意启发式策略,可以得到
个反事实样本
。如上所述,由于反事实干预(条件干预)要求生成的反事实样本必须也能够推荐出目标物品
,因此,利用推荐模型
对反事实样本
进行预测,选择
个物品
。如果目标物品
,则把反事实样本纳入候选集,最终得到反事实样本集合
。
Calculate the Expectation
在真实观测样本和反事实样本上,利用上述公式5,计算。**由于不知道反事实样本可能的出现概率,以及它们与实际观测数据可能出现概率的关系(大小关系),因此采用均匀分布来分配概率,可以表现为下图所示的公式,
- 观测数据的概率稍大些(因为实际被观测到),记作
。
- 反事实样本的概率稍小些,所有的反事实样本的概率均为
。

由此可以得到,其计算公式如下图所示。其中,
表示推荐模型估计的条件概率。

心得体会
对用户偏好的影响(文中斜体)
个人感觉,这里虽然改变历史交互行为可能影响用户的喜好,但是历史行为更多的是通过改变推荐模型的决策,进而改变
,最终改变用户的反馈。这个反馈可能是对其他物品的,但是都表示这一次(当次推荐请求的)反馈。貌似还不能够估计出,改变用户兴趣的部分。
或者这么说,是固定的,我们需要估计的是在各种展示概率的情况下,我们能看到用户会对该物品表现出多大偏好。
均匀分布
在求期望时,作者利用随机分布给观测数据和反事实样本分配其出现的概率,这种做法在不知道真实分布的情况下是符合最大熵原理的。文章中作者也提到,可以利用其他一些复杂的分布,不过这些将作为未来的工作。此时,其实就是利用一些领域的先验知识。
文章引用
[30] Judea Pearl, Madelyn Glymour, and Nicholas P Jewell. 2016. Causal inference in statistics: A primer. John Wiley & Sons.
(为了保证对应可查,引用将遵循原文的顺序和标号,额外引用将用*代表)
(虽然如下图所示有点多,如果觉得有用,不吝赞一个哇.)
网友评论