1.产生背景
基于内容的推荐算法是基于标的物的相关信息、用户信息及用户对标的物的操作行为来构建推荐算法模型,为用户提供推荐服务,这里的标的物相关信息可以是对标的物文字描述的metadata信息、标签、用户评论、人工标注的信息等。用户相关信息是指人口统计学信息(如年龄、性别、偏好、地域、收入等等)。用户对物的操作行为可以是评论、收藏、点赞、观看、浏览、点击、加购物车、购买等。基于内容的推荐算法一般只依赖于用户自身的行为用户提供推荐,不涉及到其他用户的行为。广义的标的物相关信息不限于文本信息、图片、语音、视频等都可以作为内容推荐的信息来源,只不过这类信息处理成本较大,不光是算法难度大、处理的时间及存储成本也相对更高。基于内容的推荐算法是最早应用于工程实践的推荐算法,有大量的应用案例,如今日头条的推荐有很大比例是基于内容的推荐算法。
2.特点
2.1. 个性化推荐
2.2. 用户历史行为
2.3. 物品相似性
3.网络结构
上图为盗图
4.算法模型
4.1. 基于用户历史行为记录做推荐
4.2. 用户和标的物特征都用显示的标签表示,利用该表示倒排索引法做推荐
4.3. 用户和标的物嵌入到同一个向量空间,基于向量相似做推荐
如何构建用户特征表示?
1)用户行为记录(用户评分)作为显示特征
2)物自身的标签和用户的打分综合评判
3)向量式的兴趣特征
4)通过交互方式获取用户兴趣标签
5)用户的人口统计学特征
如何构建标的物的特征表示?
1)标的物包含标签信息
2)标的物具备结构化的信息
3)包含文本信息的标的物的特征表示
3.1)利用TF-IDF将文本信息转化为特征向量
3.2)利用LDA算法构建文章(标的物)的主题
3.3)利用doc2vec算法构建文本相似度
4)图片、音频、或视频信息
怎样利用用户信息和标的物信息为用户做推荐?
1)基于物品相似性的协同过滤
2)基于用户相似性的协同过滤
3)基于标的物相似性的聚类推荐
4)基于向量相似的推荐
5)基于标签的反向倒排索引排序的推荐
5.应用场景
5.1)个性化推荐
6.参考
网友评论