头条算法推荐学习笔记

作者: 周子鱼Jo | 来源:发表于2018-08-22 11:33 被阅读25次

    头条的内容推荐系统可以让用户顺畅的获取想看到的内容,从而形成了其核心竞争力。

    通常推荐系统分为用户和内容;分析两者之间的近似度,就可完成内容的算法推荐。计算近似度的基础媒介是标签系统(tag),在建设推荐体系之前,需要先建设标签系统,标签系统可有效的将内容分类,从而获得内容匹配值;

    还有就是搭建用户体系,通过用户体系的搭建,可获取用户的操作行为,从而掌握用户的行为变化,这对产品是非常关键的。

    搭建内容推荐系统的基础是:确定要推荐给用户的内容;搜集推荐给用户内容后的反馈,然后就是让机器学习解决;

    那么一起看看今日头条的主要推荐机制有哪些?

    基于地域推荐

    相同城市或相近地理位置的用户,算法会推荐和这些城市相匹配的热门文章;比如你在上海,做互联网产品,年龄大概是25–35岁左右,就会推荐给你上海地方这个年龄段和职业最喜欢的新闻热点;而在拉萨做服务业的,就会被推荐拉萨服务业人群热门文章了。

    基于文章关键字推荐

    算法对每篇文章提取关键词,作为描述文章内容的一种特征,与用户阅读历史文章的关键词进行匹配推荐。这样的好处是通过关键词提取和匹配能对用户兴趣等进行筛选,让用户获得和他们兴趣及人群特征相关的文章。怎么来判定阅读者的人群特征呢?可以从阅读者的年龄、性别、地域、职业、兴趣爱好等方面出发, 也包含了用户的好友关系、阅读相关(tag系统)、回复对象、评论对象、转发内容、收藏内容等;

    基于站内普适性的热门文章推荐

    根据一级tag,将这些tag下最热门的文章筛选后做阅读推荐排序,再根据用户的阅读喜好,直接筛选用户兴趣相关的头部最热文章做推荐;

    基于社交好友关系的阅读习惯推荐

    获取用户第三方登录的好友,根据这些好友的转发内容、评论或所发布内容的相似度进行推荐;也可通过站内的关注关系来获取用户的好友兴趣关键词,进行相关内容的匹配和推荐;

    基于相似用户的阅读习惯做推荐

    当有基础的用户人群特征后,可对用户人群做细分,将相似人群的阅读内容筛选最热的20个内容源做推荐。

    当然以上这些都是基于已经有了基础内容和用户基数,如何从0到1搭建冷启动的推荐系统对于很多初创团队来说很重要。

    一般的新产品会先给用户一个初始兴趣值,比如让用户手动选择感兴趣的话题,如即刻一开始就是让我们选择自己的性别和兴趣爱好,这种需要基于效用推荐类的算法;但是这种手动输入的方式是不足以产生高质量的推荐的。

    头条是把用户的第三方微博账号内容和兴趣绑定在了一起,用户使用微博账号登录后,用户初始兴趣就可以快速的和微博上的兴趣行为做匹配了。完成了用户体系的从0到1,头条在内容这块是将整个互联网的新闻都纳入了自己的信息源,虽然惹来了不少的版权争议,但可以喂给机器海量的内容作为数据源,更好的做推荐匹配。

    相关文章

      网友评论

      本文标题:头条算法推荐学习笔记

      本文链接:https://www.haomeiwen.com/subject/nmtxyftx.html