美文网首页
7M推荐系统 - S0 推荐业务,Feed流产品及推荐算法策略架

7M推荐系统 - S0 推荐业务,Feed流产品及推荐算法策略架

作者: 左心Chris | 来源:发表于2020-01-07 19:16 被阅读0次

1 推荐业务

排序模型

  • 召回->粗排->精排
    精排 y = model(user, item, context)
    粗排 y = model(item, context)
  • 特征:
    item特征:统计特征,内容特征如title,标签,视频内容
    用户特征:统计特征,用户历史记录,用户本身的属性
  • 特性
    短视频,每天新增1000万,资讯每天新增1亿
    latency不超过0.1秒

召回分支

  • 召回方法
    多个召回merge成一个候选集
  • 数据
    app客户端埋点 -> 用户产生点击,浏览,点赞,评论 -> 回传服务器 -> kafka,上传实时计算集群 -> label拼接,形成log,然后我们根据数据进行建模
  • rerank
    规则打散,业务逻辑

产品视角

飘红点击率高10%
竖版(快手)比横版(头条)点击率高10%
一般基本有5个tab,但是微信只有4个tab
rerank根据产品和运营需求,比如强插美女视频,比如横版为竖版

推荐系统评估与实践

  • 准确性
  • AUC
  • 冷启动:偏好:新用户冷启动倾向于热门,老用户更加需要长尾
    1.收集用户特征 使用X2I召回
    用户注册信息:性别,年龄,地域
    设备信息:定位,手机型号,app列表
    社交信息,推广素材,安装来源
    2.制造粗粒度选项,引导用户填写兴趣
    3.迁移学习,使用其他站点的行为数据

2 特征方法

item特征

item的类别和统计类特征
量纲和平滑
离散和连续特征和相互转化

用户特征

用户画像库和标签
U2I特征(某个userid买了多少itemid),交叉特征(主要是id交叉)

数据的存储和使用

使用支持Map-Reduce的数据库进行存储比如hive,使用Mapper和Reducer
如果id都在一起的话,使用均匀哈希分桶和数据倾斜

  • 离线
    在线(快)和离线(大)
    在线使用hbase存储数据
    在线和离线数据同步 hive数据同步到hbase
  • 特征服务平台
    管理特征,特征共用,特征的生命周期,离线特征和实时特征

Embedding

one-hot representation 01
distributed representation 聚类

  • Embedding多角度看,是映射
    FM 分解,对embedding二阶特征组合
    Word2vec 中间层
    Deeplearning 中间层

特征工程

简单模型+复杂特征
复杂模型+简单特征

  • 线性模型的特征工程
    二阶特征和高阶交叉
    单变量的非线性变换
    特征预处理和归一化或者标准化(梯度)
  • 缺失值
    直接填充
    中位数均值填充
  • 特征选择
    方差过滤法
    相关系数法 协方差,卡方检验,互信息
    树模型的特征重要性
  • 特征降维
    PCA
    SVD
    LDA
  • 特征连续化
    embedding,空间变换
  • 特征离散化
    手动分桶,自动分桶(GBDT+LR)
  • ML Pipeline
    sklearn pipeline: fit和transform
  • 样本不均衡怎么处理
    上下采样
    基于距离SMOTE-NC
    信息类 boosting思想

相关文章

  • 7M推荐系统 - S0 推荐业务,Feed流产品及推荐算法策略架

    1 推荐业务 排序模型 召回->粗排->精排精排 y = model(user, item, context)粗排...

  • 个性化推荐

    学习元平台推荐策略1.0: 1、基于热度的推荐:哪些内容看的人多,就推荐哪些内容 学习元(feed流)热度算法:学...

  • 黑马头条推荐系统

    定位 课程是机器学习(包含推荐算法)算法原理在推荐系统的实践 深入推荐系统的业务流场景、工具使用 作为人工智能的数...

  • 推荐feed流

    feed流是推荐系统的一种常见形式,突出的产品有微博、抖音、朋友圈等 feed:每一个状态和消息,通常由用户更新 ...

  • 7M推荐系统 - S1 推荐系统和常用算法

    1 推荐系统简介 推荐系统介绍 见S0 推荐系统评估 显式反馈和隐式反馈 准确性(学术界)评分预测topN推荐,准...

  • 个性化推荐算法的四大策略02

    简单推荐策略 在复杂的推荐系统中,推荐算法作为其最核心、最关键的部分,很大程度上决定了推荐系统性能的好坏,且重点体...

  • 推荐系统

    推荐系统基础 推荐系统简介 了解推荐相关常用概念 知道推荐系统的工程架构和算法架构 知道推荐系统的常用算法 知道协...

  • Feeds流的搜索与思考

    个性化推荐的 Feed 流设计 1、是比较通用的做法,按照推荐的先后顺序组成 Feed 流内容,也就是你刚才看过的...

  • 探探

    高级算法工程师(推荐/广告方向) 岗位职责: 1、负责探探的推荐算法的策略优化及算法研究; 2、建立、完善反作弊系...

  • 两小时搭建一个推荐系统

    目前的推荐系统大都有基于物品相似度的推荐策略、基于协同过滤的推荐策略,大多数大型的推荐系统会有若干种推荐策略,最后...

网友评论

      本文标题:7M推荐系统 - S0 推荐业务,Feed流产品及推荐算法策略架

      本文链接:https://www.haomeiwen.com/subject/hvtmoctx.html