微信看一看推荐算法多目标帕累托最优

微信看一看推荐算法多目标帕累托最优

作者: 臻甄 | 来源:发表于2022-10-17 16:25 被阅读0次

微信看一看推荐算法多目标帕累托最优
经济学术语之帕累托最优：生活中的黄金搭档
数据分析中的万能宝典——帕累托最优解，你还没学会？
帕累托最优：社会治理的经济政策依据
帕累托最优法则
帕累托最优
帕累托最优
互联网基础理论
20190119博弈论2：群鸦的盛宴
“帕累托最优”状态

论文：Personalized Approximate Pareto-Efficient Recommendation
会议：ACM WWW '21: Proceedings of the Web Conference 2021 April 2021
视频：https://www.youtube.com/watch?v=RUYZXkQjjKc

Movation

推荐系统的调优往往有多个目标，而且这些目标往往都是矛盾的，冲突的
同时优化这些目标变得非常有挑战性

Pareto effciency

帕累托最优：是最好的状态，所有的目标都达到最优了，没有一个目标能在不牺牲其他目标的情况下继续提升了
dominate：如图 A dominate C ，且 Bdominate C
如果没有其他任何点可以dominate A了，那么称A 达到了帕累托最优

Limitation of existing Pareto methods

在现实的MOR系统中（多目标推荐），个性化通常是item级别的。比如使用共享的多目标权重来应用到所有的用户和物品中
但本文期望把一些个性化特征的优化带到 objective 级别

实现

提出PAPERec框架

提出了一种新型的框架 Personalized Approximate Pareto-Effcient Recommendation。
不同的用户可能会更关注不同的目标
用户可以有个性化的多目标权重
构建了两个 single-objective models 针对两个目标做预估（CTR点击率和Dell Time用户时长）
提出了一种 Pareto-oriented reinforcement learning modules，来学习个性化的目标权重，RL模型的reward主要是用于优化到帕累托最优

用MGDA （Multiple gradient descent algorithm）证明收敛，满足KTT条件。如果一个Pareto-oriented RL满足Pareto effcient，也能满足Pareto stationarity，如果能够优化到梯度等于0或者达到最小值，也就找到了帕累托最优点
建模
（1）State：第t个状态代表，在已经推荐了t-1个项目之后，需要推荐第t个项目的状态，会考虑上下文信息
（2）Action：给出一系列objective weights，在推荐列表的第t个位置
（3）Reward：所有objective的梯度的权重和的 L2-norm
模型架构
输入：用户信息、可能的行为、上下文、历史的目标权重
输出：目前的目标权重
算法：DDPG

左侧图像使用神经网络 objective model来预估目标值
个性化的目标权重训练，使用可扩展的方式训练

Experiment

dataset：真实世界集成的推荐数据集，从微信看一看里获取的，大概1.5B
在离线和在线环境都做了实验，回答3个研究问题
（1）提出的PAPERec算法怎么打败SOTA算法
（2）PAPERec在线上系统中如何运作，处理多样的多目标和衡量指标？
（3）个性化的目标权重学到了什么，能反映什么，是否合理？

实验显示新算法有明显提升

也做了在线的ABTest

做了一些分析，视频会有更高的DT权重

Contributions

提出了一种新颖的PAPERec框架，应该是第一个提出在objective级别做个性化调优至帕累托前沿的推荐系统
设计了一个新型的Pareto-oriented RL模块，来学习个性化的目标权重，可以通过直接最小化多目标梯度的L2-norm来达到 Pareto stationarity
做了充分的离线和在线评估实验，来验证objective-level的个性化的重要行，和PAPERec算法在多目标推荐系统中的有效性。并且已经应用于微信看一看产品，影响了millions的用户

相关文章

微信看一看推荐算法多目标帕累托最优
论文：Personalized Approximate Pareto-Efficient Recommendati...
经济学术语之帕累托最优：生活中的黄金搭档
1）名词：帕累托效率准则（帕累托最优） 2）解释：帕累托最优是资源分配的一种理想状态，一旦达到了这种理想状态，想要...
数据分析中的万能宝典——帕累托最优解，你还没学会？
说起帕累托最优，估计没接触过数据分析的人都听过，但是怎么用帕累托模型解决实际业务问题呢？今天老李带你盘清帕累托最优...
帕累托最优：社会治理的经济政策依据
文 | 京畿部长在经济学界，有这样一个词叫做“帕累托最优”，帕累托最优又称为帕累托效率，主要是指一种资源分配的状...
帕累托最优法则
帕累托最优提起帕累托最优，先要解释一下什么叫做帕累托改进。假设现在为固定的一群人分配一些定量的资源，分配方案...
帕累托最优
文/云飞泉跃必须承认不出场的中神通武功天下第一必须承认不用的九阴真经让天下太平七天七夜华山论剑得...
帕累托最优
（Pareto Optimality），也称为帕累托效率（Pareto efficiency），是指资源分配的一种...
互联网基础理论
【帕累托改进】 1，【帕累托最优】在不减少一方福利的情况下，就不可能增加另一方的福利 2，【帕累托改进】不...
20190119博弈论2：群鸦的盛宴
博弈论的三个基本概念：“帕累托最优”、“压倒性策略”和“纳什均衡”。 1.帕累托是一位意大利经济学家，帕累托改进的...
“帕累托最优”状态
在猎鹿博弈模式中，出现了两个“纳什均衡”。两个“纳什均衡”代表了两个可能的结局，但是无法确定两种结局中哪一个会真正...

网友评论

本文标题：微信看一看推荐算法多目标帕累托最优

本文链接：https://www.haomeiwen.com/subject/vfvdzrtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|微信看一看推荐算法多目标帕累托最优|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！