推荐系统遇上深度学习(八十三)-[阿里]记忆增强网络—MA-DN

1、背景

在CTR预估中，用户历史行为信息是很重要的一类信息，处理用户历史行为信息的很重要的一类方法是使用RNN及其变形结构（如LSTM、GRU等），下图对比了两种模型结构（传统DNN和使用GRU处理历史行为信息）：

使用GRU可以提升CTR的预测效果，但是也存在两方面的问题：

1）模型计算复杂：使用GRU结构，对于历史行为序列是串行计算，无论是线下训练还是线上预测，其计算复杂度明显提升。

2）数据准备复杂：数据准备复杂可以由下图进行形象地表示，对于DNN结构，一条日志对应一条数据，而对于GRU结构来说，如对于instance4，我们需要按顺序找到4条对应的日志，才能得到对应的训练数据，这显然是更加复杂的。

可以看到，DNN结构模型简单，线上性能较好，但利用用户历史行为信息能够达到更好的预测效果，那么是否存在一种模型结构，能够和DNN同样简单，同时能够有效利用用户历史行为信息呢？本文就来介绍一种方法，即记忆增强网络—MA-DNN模型。

2、模型介绍

MA-DNN模型的结构如下：

模型结构并不复杂，主要分为两大部分，DNN部分和记忆网络部分。

记忆网络主要存储两个向量m_u1和m_u0，这两个向量分别代表用户喜欢的内容和不喜欢的内容。

对于DNN部分，模型的输入可以分为三部分，首先是常规的feature，包括用户的feature、用户搜索关键词的feature和目标广告的feature，几部分的离散特征经过embedding层转换为对应的embedding，然后进行concat，得到第一部分输入x，另外两部分是记忆网络存储的向量m_u1和m_u0，三部分进行concat，得到DNN的输入v=[x,m_u1,m_u0]。随后，v经过多层全连接网络得到预测结果：

接下来介绍下模型训练，在对MA-DNN模型进行优化的时候，其优化目标包含两个方面：
1）CTR预估要准确
2）记忆网络能够有效捕捉用户的偏好，包括喜欢的内容和不喜欢的内容

模型的损失可以分为两部分：

第一部分loss₁的目标示使得CTR预估更准确，采用的是logloss：

第二部分loss₂的形式如下：

其中z_L代表DNN模块输出层前最后一个隐藏层的输出，该向量是对模型输入更高阶的抽象，如果对应的y=1，那么z_L在一定程度上代表用户喜欢的内容，如果y=0，那么z_L在一定程度上代表用户不喜欢的内容。可以看到，如果y=1，模型尽可能使m_u1和z_L的欧氏距离更小，如果y=0，模型尽可能使m_u0和z_L的欧氏距离更小。因此，向量m_u1和m_u0可以看成用户喜欢的内容和不喜欢的内容的抽象。

最后值得注意的是，loss2只用来训练兴趣向量，不应该影响DNN最后一层的输出z_L，所以在训练时，loss2不作用于z_L，即z_L仅通过loss1进行更新。

3、实验结果

实验结果如下：

具体实验结论不再赘述，感兴趣的同学可参考原论文。

4、总结

最后咱们再来总结一下对于历史行为序列的处理（个人整理，或有遗漏）：

1）Concat／Pooling，即将用户历史行为序列中物品对应的embedding进行concat或者pooling，实现比较简单，但没有考虑到历史行为与目标物品的相关性
2）attention，如阿里DIN，历史行为物品与目标物品进行attention计算对应的权重，然后进行加权求和，考虑了历史行为与目标物品的相关性，但是没有考虑历史行为的先后顺序以及时间因素
3）RNN结构，考虑了历史行为的时间顺序，但同样没有考虑到历史行为与目标物品的相关性
4）attention + GRU，如阿里的DIEN，考虑了用户历史行为中兴趣的演进过程，以及和目标物品的相关性，但是RNN结构线上耗时太高
5）Transformer，如阿里的BST，将RNN结构替换为Transformer，可以对历史行为进行并行处理，同时将时间因素加入到position encoding，考虑了历史行为发生的时间
6）MA-DNN，使用记忆网络处理用户历史行为，相较上述模型，实现较为简单，模型更为轻量。另外一个优势是对用户不感兴趣的物品进行了处理，而上述模型往往对用户感兴趣的物品进行处理。
7）如有补充，可在留言区留言！

网友评论

工业推荐系统

本文标题：推荐系统遇上深度学习(八十三)-[阿里]记忆增强网络—MA-DN

本文链接：https://www.haomeiwen.com/subject/ejfcahtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

推荐系统遇上深度学习(八十三)-[阿里]记忆增强网络—MA-DN

1、背景

2、模型介绍

3、实验结果

4、总结

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

工业推荐系统