1 召回算法和业界最佳实践进阶
各种Embedding方法
各种k-means方法kdtree和kball树
2 用户建模(召回、排序都会用到)
预测用户下一个浏览或者购买的类目,性别预测,年龄预测等。
3 用户特征和Item特征的常用方法
Wrappers:一个一个试
Embedded:加入正则
Filters:feature-label相关性
- 连续型特征离散二值化
离散化:等宽分桶(按值分),均匀分桶(按样本数分),k-means
二值化:要么该特征one-hot,或者three-hot - 过程
特征预排序通过信息增益IG,添加特征,细筛选特征 - 泛化和自解释
泛化是历史记录没有的
自解释是有历史记录的 - 四种类型
数值
类别
时间
文本
4 主流技术方向思考及相应model的改进方案
讲了一遍冷启动
讲了这三个算法
推荐流程概念 33:40
- 核心指标
GMV:一定时间内的商品成交总额
QPS
RT:系统响应 < 0.1s
优化排序:让模型参数减少,层数减少,但是效果会降低,是tradeoff
推荐和搜索有什么关系?
1.推荐做的好,搜索的流量下降
2.搜索这个工具是必要的
推荐做的好 -> 用户粘性,用户留存 -> DAU GMV
(短视频/电影)推荐系统和电商推荐系统相比,区别是什么?
视频推荐多看重时长,电商推荐看是否购买
量级的不同,存储方式,计算量,算法都不同 - 核心业务
首猜:首页猜你喜欢
详情页(相关推荐,播放页,关灯页)
网友评论