常用系统推荐算法
算法:电商、新闻客户端、音乐客户端都是基于系统推荐算法给每位用户者个性化显示
1. 基于流行度算法
基于流行度算法: 根据 PV
、 UV
、日均 PV
或分享率等数据按照某种热度排序推荐给用户。
优点:适合刚注册新用户,缺点:无法针对用户个性化。
优化:主流新闻与音乐客户端在第一次进入使用时候选择初始化类型标签,按照用户分群的流行度排序;「热榜上的经济内容优先推荐给经济迷」
应用:新闻网站,微博热榜
2. 协同过滤算法
协同过滤算法「Collaborative Filtering
」CF
:主要分为两类,基于用户的CF「User-base CF」与基于物品的CF「Item-base CF」
基于用户 CF 算法原理如下:
1、分析用户对 item 评价「浏览记录、购买记录」;
2、根据消费者对 item 评价计算所有用户之间的相识度;
3、与当前最相似 N 个用户批量选出;
4、N 个用户评价最高且当前用户又没有浏览过的 item 推荐给当前用户;
基于用户 CF 算法示例图如下:
基于物品 CF 算法原理大同小异,目标主体更新为物品
1、分析各个用户对 item 浏览记录;
2、依据浏览记录分析得出所有 item 之间的相识度;
3、对于当前用户评价高的 item ,找出与之相似度最高的 N 个 item;
4、讲 N 个 item 推荐给用户;
基于物品 CF 算法示例图如下:
3. 基于内容的算法
基于内容推荐算法:提取用户行为与新闻文本关键字推荐;
4. 基于模型的算法
基于模型推荐算法,机器学习,深度学习。「 //todo 」
5. 混合算法
真实应用场景中,很少直接单独使用某个推荐算法做推荐系统。融合了多个推荐算法一起,给不同算法结果分配不同权重综合推荐;
结果列表
推荐算法初步推荐 itemLists ,需要对其再次分析处理。
1、推荐内容中敏感词汇,用户隐私等,需要将其过滤;
2、多次推荐后消费者对某个 item 毫无兴趣,需要将其 item 降低权重,调整排序;
3、多样性内容推荐;
推荐结果评估
推荐算法完成后,评估算法的效果:
CTR(点击率)、CVR(转化率)、停留时间等都是很直观的数据。在完成算法后,可以通过线下计算算法的RMSE(均方根误差)或者线上进行ABTest来对比效果。
改进策略
用户画像:
1、获取整个公司业务平台用户画像数据;
2、不同设备上同步用户数据「QQID、设备号、手机号」;
3、丰富人口属性「年龄、职业、地域」;
4、更完善的用户兴趣状态;
网友评论