基于邻域的算法是推荐系统中最基本的算法,分为两类,1.基于用户的协同过滤(collaborative filter)算法,2.基于物品的协同过滤算法。
基于用户的CF算法
步骤如下:
a.找到和目标用户兴趣相似的用户集合,
b.找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目标用户。
基于物品的CF算法
基于物品的CF算法是目前业界应用最多的算法。给用户推荐他们之前喜欢的物品相似的物品。
步骤如下:
a.计算物品之间的相似度
b.根据物品的相似度和用户的历史行为给用户生成推荐列表
User CF的缺点:用户数越来越大,计算困难。
UserCF和ItemCF的比较
UserCF给用户推荐那些和他有共同兴趣爱好的用户喜欢的物品,而ItemCF给用户推荐那些和他之前喜欢的物品类似的物品。UserCF的推荐更社会化,反应了用户所在的小兴趣群体中物品的热门程度,而ItemCF的推荐更个性化,反映了用户自己的兴趣传承。
新闻类网站--适用UserCF
1.新闻类网站中用户的兴趣不是特别细化,热门程度和时效性是新闻推荐的重点。
2.技术角度来看,新闻的更新非常快,而ItemCF需要维护一张用户相关度的表,在技术上很难实现。
图书和电影网站--适用ItemCF
1.用户的兴趣比较固定和持久
2.个性化推荐的任务是帮助用户发现他感兴趣的物品
3.物品的更新速度不会特别快
UserCF vs ItemCF参考书籍:
推荐系统实践 -- 项亮
[读书笔记 |《推荐系统实践》- 个性化推荐系统总结](https://www.jianshu.com/p/319e4933c5ba)
网友评论