以后看东西能不能全部大概浏览一遍,这样,就可以大概知道要以那一块为重要方面去看了。
推荐引擎是个性化推荐中重要的组成部分, 也是推荐系统负责对外提供服务的重要组成部分。基于用户的画像,物品画像等,根据不同的推荐策略从物品推荐池中召回相关的物品。
个性化推荐系统,是主动发现用户当前或潜在阅读需求,并主动推送合适资讯给用户的信息网络,个性化推荐引擎挖掘用户的喜好和需求,主动向用户推荐其感兴趣或者需要的对象。
个性化推荐引擎基于用户画像、物品模型,通过一系列的策略,对用户进行内容的个性化推荐的系统,其按功能分为5个模块:
召回
融合
填充
过滤
重排
推荐引擎自上而下的模块包括:
召回: 基于相似用户、相似物品、画像属性、上下文等进行召回;
融合: 决定召回策略比例并截取物品数形成初步结果集,融合器有加权融合、概率融合、规则融合等等;
填充: 通过一些热门填充、规则填充,在工程上保证物品的数量,通过试投保证保证推荐的新颖度;
过滤: 通过用户历史、行为让推荐可以保证不出重复及无状态服务的手段、同时还有负反馈计算;
重排: 通过模型、规则排序,提高点击率的同时保证用户体验。
召回
根据不同的策略从物品可推荐池中获取相关的视频,生成相关的推荐候选池, 现有的召回策略如下:
基于用户画像的偏好属性(类目)
基于物品的协同过滤模型
基于用户的协同过滤
基于上下文的召回(需要建立模型)
LM隐含因子: 基于视频tag,离线计算阶段建立相关的模型
融合
交叉融合法:blending 召回结果进行穿插 ,输入用户长期兴趣,短期兴趣
特征融合法:基于特征工程
Nearline系统: 准实时更新对应策略的权重
填充
对融合的结果进行填充, 填充的策略包括:
热门填充:
点赞topN:点赞次数的排序列表, 时间衰减
精品用户发布的视频排序列表
72小时热门音乐下的商品
72小时热门话题下的商品
各个类目下的top20 商品
运营热点视频
基于规则的填充:
用户关注的人发布的视频
新品分级投放
运营强推
基于完播率
fb好友,但是vskit未关注的人发布的视频
过滤
过滤规则:
用户已经看过的视频
用户负反馈的视频, 包括dislike, 举报等
重排
对每一刷的结果进行重新排序,业界通用基于ctr预估。 对于vskit短视频业务,目前基于播完率预估
通用模型:
规则重排
针对不同的策略设置权重,对召回结果进行融合。 建立融合模型,根据用户实时的行为反馈动态的调整融合权重。参考多模型融合推荐算法在达观数据如何运用
线性加权融合法: 是给用户(user)推荐商品(item)的得分, 是算法K的权重,是算法k得到的用户(user)对商品item的推荐得分。
本引擎支持多种场景并存,主要场景分为依照用户兴趣推荐、依照接入方客户配置的内容为主配合用户兴趣推荐、根据当前物品的相关物品推荐。多场景并存可以给用户提供区别于传统推荐系统的更高级的产品体验。
本推荐系统构建在网易云计算服务组件之上:
网易云计算对象存储基础服务:对本文、图片、视频、音频等内容的存取与CDN服务;
网易云计算通信与视频云视频处理服务:对视频类型内容提供转码支持;
网易Mammut大数据开发计算平台:对实时或离线数据提供大数据分析服务,及推荐数据建模.
底层技术涉及GPU深度学习计算,web服务器,hadoop集群、Redis集群、数据传输服务Datastream、关系型数据库等.
网友评论