推荐系统 - MMoE模型

推荐系统 - MMoE模型

作者: nlpming | 来源:发表于2021-07-20 00:47 被阅读0次

推荐系统 - MMoE模型
用户行为关联与推荐：多目标与多任务学习02
我要打十个：多任务学习模型MMoE解读
推荐系统-推荐模型
隐语义模型与推荐算法
推荐系统遇上深度学习(三)--DeepFM模型理论和实践转载
一文简单理解推荐系统
LFM——潜在因素模型
mmoe
推荐系统算法（传统推荐模型）

1. 简介

MMoE（Multi-gate Mixture of Experts）由Google发表在KDD 2018会议上。在推荐系统领域，我们不仅要推荐用户感兴趣的东西，并且要尽可能促进购买。所以我们需要同时要优化CTR和CVR模型，阿里巴巴提出ESMM模型给出了一个解决方案，同时优化pCTR和pCTCVR。但是ESMM是一个典型的Shared Bottom Model，两个模型共享一部分参数。多任务学习存在一个明显的问题是，当两个子任务差别非常大的时候效果不太好。因此Google在MoE模型的基础上提出MMoE模型，能够同时捕捉子任务之间的相关性和差异性。

2. MMoE模型结构

2.1 Shared-Bottom model

常用的多任务学习框架，如下图所示。两个子任务之间共享一个Shared Bottom网络（ $f(x)$ ），每个子任务分别对应一个tower网络，假设为 $h^k$ ；那么第 $k$ 子任务的输出为： $y_k = h^k(f(x))$ 。
Share Bottom model代码实现：https://github.com/shenweichen/DeepCTR/blob/master/deepctr/models/multitask/sharedbottom.py

Shared-Bottom model.png

2.2 One-gate MoE model

One-gate MoE模型，使用单个Gate组合MoE模型输出的结果。MoE由多个专家（expert）网络组成，每一个expert网络可以认为是一个前馈神经网络。Gate网络计算得到在每个expert上的概率值，最后通过加权得到的输出，输入到每个子任务的tower网络中。假设总共有 $n$ 个expert网络，每个expert网络的输出为 $f_i(x)$ ，对于第 $i$ 个expert网络，Gate网络输出的概率值为 $g(x)_i$ ，则每个tower网络的输出为：
$y_k = h^k \left( \sum_{i=1}^{n} g(x)_i f_i(x) \right)$
其中Gate也是一个子网络，生成在Expert网络上的概率分布： $\sum_{i=1}^{n} g(x)_i = 1$

One-gate MoE model.png

2.3 Mult-gate MoE model （MMoE）

MMoE在One-gate MoE模型基础上进行改进，对每个子任务都引入一个Gate网络，以此来捕获不同子任务之间的差异性。 Expert网络对于子任务之间共享，用于学习子任务之间的相关性。最终每个子任务tower网络的输出为：
$y_k = h^k \left( \sum_{i=1}^{n} \color{red}{g^k(x)_i} f_i(x) \right)$
$g^k(x) = softmax(W_{gk} x)$

Mult-gate MoE model .png

3. MMoE模型理解

下图中 $bs$ 代表batch size大小， $hidden\_units$ 代表DNN隐层大小， $num\_experts$ 代表专家网络的数量；
MMoE tensorflow代码实现：https://github.com/shenweichen/DeepCTR/blob/master/deepctr/models/multitask/mmoe.py
MMoE模型理解.png

参考资料

【MMoE论文】Modeling Task Relationships in Multi-task Learning with
Multi-gate Mixture-of-Experts https://dl.acm.org/doi/pdf/10.1145/3219819.3220007
详解谷歌之多任务学习模型MMoE(KDD 2018) https://zhuanlan.zhihu.com/p/55752344

相关文章

推荐系统 - MMoE模型
1. 简介 MMoE（Multi-gate Mixture of Experts）由Google发表在KDD 20...
用户行为关联与推荐：多目标与多任务学习02
续用户行为关联与推荐：多目标与多任务学习01 多门混合专家模型（MMoE）多门混合专家模型（Multi-gate...
我要打十个：多任务学习模型MMoE解读
今天要介绍的是一个多任务学习模型MMoE[https://dl.acm.org/doi/pdf/10.1145/3...
推荐系统-推荐模型
回答一个最关键的问题：什么是推荐系统？下面从3个角度来回答：它能做什么它需要什么它怎么做先来第一个问题推...
隐语义模型与推荐算法
隐语义模型与推荐算法标签：推荐算法 LFM(latent factor model)隐语义模型，这也是在推荐系统...
推荐系统遇上深度学习(三)--DeepFM模型理论和实践转载
原理链接推荐系统遇上深度学习(三)--DeepFM模型理论和实践推荐系统遇上深度学习系列：推荐系统遇上深度学习...
一文简单理解推荐系统
本文主要介绍什么是推荐系统，为什么需要推荐系统，如何实现推荐系统的方案，包括实现推荐系统的一些常见模型，希望给读者...
LFM——潜在因素模型
推荐系统（2）—LFM（Latent Factor Model）模型推荐系统学习笔记之三 LFM (Latent...
mmoe
参考文献：https://blog.csdn.net/leon_winter/article/details/10...
推荐系统算法（传统推荐模型）
推荐系统经历两个阶段：传统推荐模型和深度学习模型第一阶段：传统推荐模型(协同过滤，矩阵分解，LR, FM, FF...

网友评论

本文标题：推荐系统 - MMoE模型

本文链接：https://www.haomeiwen.com/subject/rhvkmltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|推荐系统 - MMoE模型|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！