MMOE模型的基础结构
概念
多目标任务学习(MTL)指有两个或两个以上的目标函数,目的是寻求一种排序使得所有的目标函数都达到最优或满意
相关指标:点击,浏览时长,加购物车,收藏,购买,复购,好评等
主要目标
-
多个目标定义一个综合的损失函数
-
多个任务之间信息共享的复杂性和差异性
CTR与CVR之间的平衡(跷跷板现象)
模型结构
![](https://img.haomeiwen.com/i27579716/b5fd0f8cf4d52064.png)
两种不同目标
第一部分:Output A & Tower A
第二部分:Gate A/B 不同门控
第三部分:Expert 0/1/2 不同专家,信息共享块
第四部分:Input输入
整体结构抽象看,如下图:
![](https://img.haomeiwen.com/i27579716/8b8d063ab5e17c43.jpg)
将DNN模块抽象为特征抽取器模式,我们来仔细看特征抽取器中有哪些内容。
注:这些都可以任意替换。
![](https://img.haomeiwen.com/i27579716/65fa814a42912df3.jpg)
基于ESMM
![](https://img.haomeiwen.com/i27579716/c5a6f1d65b6dab6c.png)
![](https://img.haomeiwen.com/i27579716/580213b52fe258a8.png)
从ESMM延伸到MMOE
![](https://img.haomeiwen.com/i27579716/c6a94e34ed5756f1.png)
![](https://img.haomeiwen.com/i27579716/43da40b159c3cf36.png)
门控 softmax归一化后 输出的权重个数 = 专家系统个数
区别于ESMM:
-
专家系统
-
门控
MMOE的注意事项
多个expert加权求和
gate的softmax输出长度 = 专家系统个数
MMOE的应用场景
广告、推荐、搜索等排序场景
需要对多个目标进行同时提升的情况
网友评论