如果用一句话来概括,个性化内容推荐的原理就是:
物以类聚、人以群分。
物以类聚:Item-Based
内容本身:
基于文章彼此间的相似度来决定一篇新内容是否需要推荐给阅读过某篇旧文的用户。
文章间相似度常见的因素有:
- 属性相似性:作者(订阅 or 偏好关系)
- 内容相似性:关键词、话题、类目、聚类、标签
Item-Based的方式,可以更直观的理解为我们常说的打标签。一篇文章有N个标签,一个用户有N个标签,将有相同标签的文章推荐给有相同标签的用户。
人以群分:User-Based
基于阅读者彼此间口味的相似度来决定一篇内容是否可以扩散。
比如,用户A偏好阅读科技类文章,与他同好的科技圈的朋友都已经阅读了文章B,那么文章B也应该推荐给用户A。
从Item 到 User
通常的,Item-Based用于冷启动环节,这是因为初始态下,值得推荐信赖的因素过少所致。
在经历过一些展示和点击,有了用户行为的反馈之后,行为数据更好辅助判断一篇文章的消费价值以及它适合的人群。一些标题党的内容,也会在这个阶段被发现和淘汰。
在此基础上,再逐步转向User-Based推荐,使得文章得到更精准(预估点击率更高)的推荐和更广泛的传播。
网友评论