推荐系统论文阅读（十七)-阿里巴巴深度会话兴趣网络

一、背景

在正式介绍这篇论文之前，说一个自己对于前面那些阿里推荐系统论文的见解，我发现无论是din，还是dien中，模型的输入特征都是相似的，用户侧主要是点击序列，物品侧主要是是一些类别特征，店铺特征等。可以看到，无论是在din还是dien中，模型的重心都是在处理session，无论是din中对点击序列进行sum pooling操作，还是在dien中用gru去对点击序列建模都是为了更好地从用户对点击序列中探秘出用户的兴趣点。而在我们那这篇DSIN中也是类似的做法，重点处理session，下面就开始介绍吧。

用户的session一般是这样的：

直观的理解是这样，用户同一个session中的物品是相似的，比如第一排都是跟裤子相关的物品，第二排就都是戒指相关的了。这也说明了，session中的物品可以代表当时用户的兴趣点，如果我们能抓住用户在某个时刻的兴趣点，那么我们就能很容易给我用户推荐那些相似的物品了。

怎么划分session呢？在之前airbnb那篇论文中，我们也提到了划分方式：首先将用户的点击行为按照时间排序，判断每两个行为之间的时间间隔，前后的时间间隔大于30min，就进行切分。上面的图中每个session的间隔都是大于30min的。

为了更好的利用session信息，阿里提出了深度会话兴趣网络来对session信息更好的建模，深入分析到了session隐藏的用户兴趣。

二、模型结构

咋一看这个网络你可能会有点懵又有点熟悉的感觉，没错，这个就是跟你之前看过的dien相似，回一下dien的模型结构是不是差不多长这样。模型结构一共分为好几部分，下面我们来一部分一部分介绍。

2.1 Base Model

这部分是用于对比的，Base Model就是一个全连接神经网络，其输入的特征的主要分为三部分，用户特征，待推荐物品特征，用户历史行为序列特征。用户特征如性别、城市、用户ID等等，待推荐物品特征包含商家ID、品牌ID等等，用户历史行为序列特征主要是用户最近点击的物品ID序列。

这些特征是跟DSIN的输入特征一样，只有模型结构不一样，一般这些特征都是通过embedding层然后concat后送到全连接层后进行分类，损失函数使用logloss。

2.2 User Item Feature Representation

这部分内容就不详细介绍了，跟din，dien中用户侧，物品侧的兴趣抽取方式一样，把候选物品和用户特征经过embedding层后送到concat层后准备进行后面的分类任务。

2.3 Session Division Layer

这里先说明一下，我们在介绍这四部分的时候默认embedding层是特征必须经过的层，所以后面就不介绍embedding层了。

Session Division Layer主要是对用户按时间顺序点击过的物品S进行session切分，按照间隔大于30min进行切分，得到用户的session序列Q：第k个会话为Qk=[b1;b2;...;bi;...;bT],其中，T是会话的长度，bi是会话中第i个行为，是一个d维的embedding向量。所以Qk是T * d的。而Q，则是K * T * d的。