因果推断推荐系统工具箱 - CCF（三）

作者: processor4d | 来源:发表于2021-12-31 22:28 被阅读0次

因果推断推荐系统工具箱 - CCF（三）
因果推断推荐系统工具箱 - CCF（四）
因果推断推荐系统工具箱 - CCF（一）
因果推断推荐系统工具箱 - CCF（二）
因果推断推荐系统工具箱 - CASR（三）
因果推断推荐系统工具箱 - NCIS（三）
因果推断推荐系统工具箱 - ACL（三）
因果推断推荐系统工具箱 - DSC（三）
因果推断推荐系统工具箱 - Dual Bandit（三）
因果推断推荐系统工具箱 - DICE（一）

文章名称

【AAAI-2019】【Rutgers University】Causal Collaborative Filtering

核心要点

文章旨在将现有的基于相关性的协同过滤模型，扩展到基于因果的协同过滤模型，使得模型能够打破观测数据的边界，真正的估计那些没有被观测到的反事实结果。作者提出了一个通用的协同过滤框架CCF来建模推荐系统中的因果关系，并且表明原有的基于相关性的协同过滤模型是CCF的特例，是简化CCF因果图之后的结果。作者还提出了一个条件干预方法来模拟do-calculus，以此从观测数据中估计因果关系，并利用新提出的反事实约束学习框架估计用户对物品的偏好。

上一节描述了如何把估计 $p(y|u, do(v))$ 的问题转化为条件期望 $E_{x|u}[p(y|u, x, v)|_{v=g(u,x)}]$ ，并且强调存在其他的交互历史 $p(x\prime|u) \neq 0$ 的情况，需要进行反事实推理。本节继续介绍，反事实推理和基于反事实约束的学习方法。

方法细节

问题引入

上一节提到估计 $p(y|u, do(v))$ 等价于估计条件期望 $E_{x|u}[p(y|u, x, v)|_{v=g(u,x)}]$ 。这里的 $x$ 需要是所有可能的交互，而不仅仅是观测到的实际交互，也就是需要生成反事实 $x\prime$ 。作者把子图c的因果图改为子图d中的因果图。这样的改动，把随机变量 $U$ 变为外生变量，其他的随机变量 $X, V, Y$ 是链式结构。如果 $X$ 是全部的可能结构，那么 $V$ 则是所有可能的被推荐的物品（也就是无偏的，不但推荐的物品的个数可能发生变化，概率也可能发生变化），这样估计的偏好也将是无偏的。

manipulation causal graph

作者把用户偏好的无偏估计公式表示如下，其中 $\tilde{x}$ 表示所有可能的历史交互。此时，我们需要估计在所有可能的历史交互下，物品 $v$ 被推荐的可能以及其对用户偏好的影响。估计所有可能性的期望值，作为用户偏好的估计值。

unbiased user preference estimation

具体做法

如前所述，为了实现在所有交互历史的情况下，通过估计推荐特定物品 $v$ 的期望，来估计干预 $p(y|u, do(v))$ ，需要反事实推理。具体需要经历三个步骤，

生成反事实样本。生成的反事实样本一般被要求是在真实样本上进行最小的改动[30]，并改变模型的判断。在文章的场景中，要求经过最小改动，使得用户行为历史 $x$ 变为反事实样本 $x\prime$ 。

筛选反事实样本。因为我们要求被推荐的物品是 $v$ （因为 $do(v)$ ，所以， $v = g(\tilde{x}, u)$ 得到的 $v$ 必须和目标的 $v$ 一致，需要过滤掉不符合条件的反事实样本。

计算条件期望。此时，需要知道每一个反事实样本出现的条件概率。然而，这个概率是未知的，因此，作者利用均匀分布（因为不知道任何信息，基于最大熵的原理，就选择均匀分布），平均分配反事实的概率。观测事实的概率大于其他均匀分布的反事实。（作者表示其他分布将来会尝试）。

Generate Counterfactual Examples

生成反事实样本时，作者首先采用启发式的方法，包括3种策略，

Keep One，K1。在真实的历史行为中，只保留用户的一个交互行为。

Delete One，D1。从用户真实的历史行为中，删除一个用户的交互行为。

Replace One，R1。从用户真实的历史行为中，替换一个用户的交互行为。

在R1策略中，又可以分为，随机替换和最近邻替换，其中最近邻的度量embedding的欧氏距离。

Select Counterfactual Examples

假设用户历史行为序列为 $(u, x, v, y)$ ，利用上述任意启发式策略，可以得到 $m$ 个反事实样本 $x_1^\prime,\ldots, x_m^\prime$ 。如上所述，由于反事实干预（条件干预）要求生成的反事实样本必须也能够推荐出目标物品 $v$ ，因此，利用推荐模型 $g$ 对反事实样本 $x_i^\prime$ 进行预测，选择 $top-k$ 个物品 $V^\prime_i$ 。如果目标物品 $v \in V^\prime_i$ ，则把反事实样本纳入候选集，最终得到反事实样本集合 $\{ (u, x^\prime_i, v, y) \}_{i=1}^{n}$ 。

Calculate the Expectation

在真实观测样本和反事实样本上，利用上述公式5，计算 $p(y|u,do(v))$ 。**由于不知道反事实样本可能的出现概率，以及它们与实际观测数据可能出现概率的关系（大小关系），因此采用均匀分布来分配概率，可以表现为下图所示的公式，

观测数据的概率稍大些（因为实际被观测到），记作 $\alpha$ 。
反事实样本的概率稍小些，所有的反事实样本的概率均为 $\beta$ 。

distribution of examples

由此可以得到 $p(y|u,do(v))$ ，其计算公式如下图所示。其中， $P_g$ 表示推荐模型估计的条件概率。

p(y|u,do(v))

心得体会

对用户偏好的影响（文中斜体）

个人感觉，这里虽然改变历史交互行为可能影响用户的喜好，但是历史行为更多的是通过改变推荐模型 $g$ 的决策，进而改变 $V$ ，最终改变用户的反馈。这个反馈可能是对其他物品的，但是都表示这一次（当次推荐请求的）反馈。貌似还不能够估计出，改变用户兴趣的部分。

或者这么说， $Y = f(U,V)$ 是固定的，我们需要估计的是在各种展示概率的情况下，我们能看到用户会对该物品表现出多大偏好。

均匀分布

在求期望时，作者利用随机分布给观测数据和反事实样本分配其出现的概率，这种做法在不知道真实分布的情况下是符合最大熵原理的。文章中作者也提到，可以利用其他一些复杂的分布，不过这些将作为未来的工作。此时，其实就是利用一些领域的先验知识。

文章引用

[30] Judea Pearl, Madelyn Glymour, and Nicholas P Jewell. 2016. Causal inference in statistics: A primer. John Wiley & Sons.

（为了保证对应可查，引用将遵循原文的顺序和标号，额外引用将用*代表）
（虽然如下图所示有点多，如果觉得有用，不吝赞一个哇_.）

因果推断推荐系统工具箱 - CCF（三）
文章名称【AAAI-2019】【Rutgers University】Causal Collaborative ...
因果推断推荐系统工具箱 - CCF（四）
文章名称【AAAI-2019】【Rutgers University】Causal Collaborative ...
因果推断推荐系统工具箱 - CCF（一）
文章名称【AAAI-2019】【Rutgers University】Causal Collaborative ...
因果推断推荐系统工具箱 - CCF（二）
文章名称【AAAI-2019】【Rutgers University】Causal Collaborative ...
因果推断推荐系统工具箱 - CASR（三）
文章名称【SIGIR-2021】【Beijing Key Laboratory of Big Data Mana...
因果推断推荐系统工具箱 - NCIS（三）
文章名称【WSDM-2020】【Criteo Research】Offline A/B testing for ...
因果推断推荐系统工具箱 - ACL（三）
文章名称【NIPS-2020】【Walmart Labs】Adversarial Counterfactual ...
因果推断推荐系统工具箱 - DSC（三）
文章名称【AAAI-2019】【University College London/Noah's Ark Lab...
因果推断推荐系统工具箱 - Dual Bandit（三）
文章名称【KDD-2020】【Adrem Data Lab/Criteo AI Lab】Joint Policy...
因果推断推荐系统工具箱 - DICE（一）
文章名称【www-2021】Disentangling User Interest and Conformity...