推荐系统论文阅读（四十三)-Comirec：阿里又一篇多兴趣召回

作者: 推荐系统论文阅读 | 来源:发表于2021-03-23 21:01 被阅读0次

推荐系统论文阅读（四十三)-Comirec：阿里又一篇多兴趣召回
推荐系统（九）：阿里电商推荐算法论文导读(中)
召回
推荐系统论文阅读（二十二)-基于多兴趣向量召回的Mind
推荐系统论文阅读（二）-阿里经典论文：深度兴趣网络(DIN)
个性化推荐系统（二）---构建推荐引擎
推荐系统-CTR预估
召回常用离线评估指标
推荐系统-召回
推荐系统论文阅读（十七)-阿里巴巴深度会话兴趣网络

论文：

论文题目：《Controllable Multi-Interest Framework for Recommendation》

论文地址：https://arxiv.org/pdf/2005.09347.pdf

推荐系统中关于用户长短期兴趣建模一直是一个热点问题，而用户的多兴趣召回更是一个更加通用的对用户兴趣建模的方法，我们在之前的mind论文中已经介绍过了如何用胶囊网络来建模用户的多个兴趣点，今天我们来介绍一下阿里跟清华合作的另一篇关于多兴趣召回的文章。

一、背景

在介绍这个论文之前，我想来给读者们讲讲为什么用户的兴趣需要进行细粒度的划分，这也是我在工作中真实碰到的情况。

用户在一次session或者说一段时间内浏览了一系列物品，这时候会出现两种情况：

1.这个序列中的所有item都是同一类商品/同一个品质的相似商品，这时候我们就认为这个序列是“收敛”的，也就是这个序列中的物品趋于同质化，这时候用户的兴趣就是单点的，这时候对这个序列建模就比较简单了，不管是rnn还是直接用transformer都可以直接建模出用户在这时候的兴趣点。

2.这个序列中出现了不同品类的商品，比如说衣服和裤子和口红同时出现，这时候我们可以认为这个序列是“发散”的，这时候如果用rnn之类的序列建模方法就没那么work了，你可以相信一下，如果把一些杂乱无章的单词随便凑到一个句子中，在用transformer去建模，那么建模出来的vec表达的意思是什么呢？这时候模型就没可解释性，可能你这时候又会说了，深度学习模型只需要关心work不work，不需要关心具体的解释性了，对于这个观点我不置可否。。

回到正题，如果我们碰到了一个杂乱无章的序列，我们斗胆猜测，用户在这时候的兴趣是多点的，这时候如果强行把用户的兴趣全部杂糅到一个向量中，这时候又会出现几个问题：

1.融合的向量需要完整的表达出用户的兴趣就需要把维度设置的很大，这样训练比较困难

2.融合会让信息损失

3.融合的兴趣向量的空间可解释性比较差，我们不知道这个融合的兴趣向量为什么可以检索出top-n个item，也不知道这个融合的向量在哪个空间维度下。

当然，上面的几个问题是我在实践过程中自己碰到的，尤其是第二点，信息损失会带来很大的影响，主要是无论融合的结构无论如何设计都会让一部分信息丢失。

看一个论文中举的例子吧：