热度排行，个性化推荐机制

作者: 一只大黑猫 | 来源:发表于2017-08-30 15:37 被阅读421次

热度排行，个性化推荐机制
推荐算法简介
【九月笔记】热度算法和产品文档
推荐算法-产品角度
《探索推荐引擎内部的秘密》的思考
微信视频号运营教程之视频号推荐方式
新闻资讯类app的文章推荐规则
这么多平台，你想在哪个写？
随笔之十七丨权力与资本影响下的社交平台热度排行 ——以新浪微博热
个性化推荐算法实战第01章个性化推荐算法综述

刚看到一篇关于信息流热度排行，个性化推荐机制的文章，写此文章总结下。本文虽思想参照的前辈的，但是也是自己原创。

首先说明信息既包括文字类的信息，也包括图片，视频，甚至商品信息等信息。

解释下三个名词：

热度词库：该词库根据当前热点来更新，添加方式有两种，手动更新，抓取微博等成熟媒体热词。

标准词库：记录该产品中可能出现的信息的所有关键词。一般来说网上有专门的在线词库可供选择。

停用词库：在检索关键词时候，需要舍弃的词语，比如“我”，“想”等一些没有实际含义的词语。

一、信息热度排行机制

此处信息热度排行类似于微博的热搜，百度风云榜，今日头条的热点等。当然此处的排行机制相比较于几位大头的算法机制较为简单，但是对于热度排行的学习还是有很大帮助的。

公式：信息的热度（H）=信息的初始热度（H0）+信息的交互热度（H（User））-随时间递减的热度（H（Time））

首先得出该信息的所有关键词，方式：发布人自定义标签＋系统根据标准词库和停用词库进行系统筛选。

1.信息的初始热度（H0）

（1）第一种计算方法：根据该信息所属的分类进行热度计算。例如，娱乐类的S（0）= H * 1.5，体育类的S（0）= H * 1.2。

（2）第二种计算方法：计算该信息的所有关键词与热词库的匹配度。S（0）=匹配度*H。

2.信息的交互热度（H（User））

H（User）=（1*阅读数+ 2*推荐数+ 3*评论数+ 4*分享数）* N。

3.随时间递减的热度（H（Time））

一个信息的热度应该随时间指数递减的，所以H（Time）表示应该如下图：

此处应为一个随时间递增的指数函数，一个点为引爆点。

二、个性化推荐机制

1.基于内容的个性化推荐

（1）首先得出该信息中关键词集合。（根据标准词库以及用户自定义标签得出。）

（2）计算出关键词集中单个关键词对应的tfidf值，tfidf值= tf * idf,用于衡量该关键词对于该信息的重要程度，其中tf是指该关键词在该信息内出现的频率，idf指的是该关键词在所有信息内出现的频率的相反值，一般来讲，tf，idf越高，该关键词越具有代表性。

（3）得出该信息的特征向量。

（4）文章关联性之间的应用。

计算两个信息的特征向量，然后得出两个向量的cos值。用cos值来表示两个信息之间的相关性。这种常应用于相关文章推荐板块，相关视频推荐版块。

（5）利用用户特征向量来给用户推荐信息。

当用户阅读完一条信息后，对于该信息会有一个信息的特征向量为：

对应的该用户的行为向量为：

read,like,comment,share代表用户的各种行为，1,2,3,4分别代表各种行为的权重（人为赋予。）

最终得出该用户的特征向量为：

随着用户阅读的信息量不断增多，用户特征向量越来越丰富，再用用户特征向量与各个文章相匹配，就能进行个性化推荐了。

2.基于用户的协同推荐

（1）获取用户数据信息

a.外部数据。微信登录，qq登录可以获取昵称，头像。

B.主动询问。例如，某些app会一开始询问你性别，年龄等。

（2）根据获取的用户信息以及前面所说的用户特征向量进行用户分群。

（3）对于用户X，他处于群体S（X，n），得出该群体的信息集合。分别得出用户X分别与每一个信息的得分（第一个指标是用户X与S（X，n）中每个用户之间的关联度，第二个指标是每个用户对于该信息的关联度）。

（4）根据每个信息的最终得分向用户X进行推荐。

小结：以上都是基本的机制算法，实际运用当中，应该是结合使用，并且根据实际情况有侧重点。

微信公众号：多一点思考，欢迎关注

网友评论

本文标题：热度排行，个性化推荐机制

本文链接：https://www.haomeiwen.com/subject/okntjxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

热度排行，个性化推荐机制

相关文章