2020 推荐系统入门 (2)

作者: zidea | 来源:发表于2020-07-02 20:39 被阅读0次

2020 推荐系统入门 (2)
推荐系统实践
2020 推荐系统入门 (3)
2020 推荐系统入门 (1)
无标题文章
推荐系统实践-char1
推荐系统入门
推荐系统书籍
推荐策略入门|《推荐系统实践》
推荐系统实践学习系列（一）好的推荐系统

recommendation_sys.jpeg

图

数据是一切的保证，只有肥沃的土地才能长出好的庄稼，再现代化机器播种和收割也无法取代土地对收成起着决定性的重要地位。

数据来源

首先我们看如何收集数据

显式数据
- 评分
- 评论/评价
隐式数据
- 历史订单
- 加入购物车
- 页面浏览
- 点击
- 搜索记录
  显式收集数据比较好理解，也容易收集。而隐式数据需要我们花一些心思进行设计，如何有效预埋点来采集用户行为。

特征工程

所谓特征工程就是，用一些物品的关键词(标签)将物品明确地表示描述出来，并且便于与其他物品进行区分。这些特征也包括用户对物品描述，也就是将物品抽象为一系列词，这些词用于判断用户是否喜欢该物品

| item\user | tony | jerry | alice | mike | joan |
|---|---|---|---|---|---|---|---|
| AItem | 1 | | .25 | | .25 |

这就是 user-item 表，1 表示 tony 用户对 AItem 评分。

| item\user | tony | jerry | alice | mike | joan |
|---|---|---|---|---|---|---|---|
| AItem | 1 | | .25 | | .25 |
| BItem | | .25 | | | .25 |
| CItem | 1 | | .25 | | |
| DItem | | | .25 | | 1 |
| EItem | | .25 | | | .25 |

基于内容特征提取还会用分词、word2vec

选择合适机器学习模型

这部分内容是随后重点介绍的内容。

预测输出

cross-sell
Up-sell

协同过滤

之前我们已经介绍了什么是协同过滤，以及什么是User-based CF 和 Item-based CF，今天重点说一说相似度计算。

图

相似度计算

在协同过滤中相似度的算法选择也是根据实际情况而定，例如如果数据是用户评分，也就是实数情况，

第二种情况就是布尔值

余弦相似度

KNN 中就会用到各种不同方法来计算两个向量间距离，余弦距离就是计算两个向量在空间的夹角，如果他们重合就是 1 垂直就是 0 也就是他们没有相关性，180 就是 -1 ，从而我们可以得到两个向量间的关系。
余弦相似度忽略向量长度，仅考虑向量的角度。所以假设 Alice 给 A 和 B 两个物品的评分分别是 8 和 5 而 Tony 给 A 和 B 物品评分为 1 和 0.5 通过余弦相似度似乎他们很接近，但是实际好像并非如此。

皮尔逊相关系数(Pearson's Correlation)

$r = \frac{\sum_{i=1}^n (x_i - \mu_x)(y_i - \mu_y)}{\sqrt{\sum_{i=1}^n (x_i - \mu_x)^2} \sqrt{\sum_{i=1}^n (y_i - \mu_y)^2}}$

对余弦相似度优化，对向量去中心化。每一个分量做平均值，5 和 3 然后求均值 6.5 然后分别 8 和 5 去掉均值得到 1.5 和 -1.5 ，然后 1 和 0.5 情况类似 0.75 然后得到去中心化的分别为 0.25 和 -0.25，然后在计算得到值要由于仅用余弦相似度计算两个向量间距离。所谓优于余弦相对度就是因为在皮尔逊相关中考虑到了长度。

如果评分数据是连续数值，适合用余弦相似度和皮尔逊相关系数来计算。

杰卡德相似度

所谓杰卡德相似度是交集除以并集。适合用于杰卡德相似度来计算。

网友评论

本文标题：2020 推荐系统入门 (2)

本文链接：https://www.haomeiwen.com/subject/ouldqktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

2020 推荐系统入门 (2)

推荐算法架构

Match

Rank

策略调整

推荐算法

如何构建推荐模型

数据

图

数据来源

特征工程

选择合适机器学习模型

预测输出

协同过滤

图

相似度计算

余弦相似度

皮尔逊相关系数(Pearson's Correlation)

杰卡德相似度

相关文章

2020 推荐系统入门 (2)

推荐系统实践

2020 推荐系统入门 (3)

2020 推荐系统入门 (1)

无标题文章

推荐系统实践-char1

推荐系统入门

推荐系统书籍

推荐策略入门|《推荐系统实践》

推荐系统实践学习系列（一）好的推荐系统

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

深度学习

科学