向量空间：如何实现一个简单的音乐推荐系统？

作者: 花椒人生 | 来源:发表于2020-07-19 22:23 被阅读0次

向量空间：如何实现一个简单的音乐推荐系统？
推荐系统
向量的点乘的应用和定义_线性代数_day7
89 90
一文简单理解推荐系统
向量空间在推荐系统中的使用
第7课求解AX=0,主变量，特解
自己动手写数据结构之循环队列
电影推荐系统python实现
线性代数之——向量空间

算法解析要解决这个问题，不需要特别高深的理论。解决思路的核心思想非常简单、直白，用两句话就能总结出来。

找到跟你口味偏好相似的用户，把他们爱听的歌曲推荐给你；
找出跟你喜爱的歌曲特征相似的歌曲，把这些歌曲推荐给你。1. 基于相似用户做推荐

一：如何找到跟你口味偏好相似的用户呢？
核心思路：把跟你听类似歌曲的人，看做口味相似的用户
方案：我们只需要遍历所有的用户，对比每个用户跟你共同喜爱的歌曲个数，并且设置一个阈值，如果你和某个用户共同喜爱的歌曲个数超过这个阈值，我们就把这个用户看作跟你口味相似的用户，把这个用户喜爱但你还没听过的歌曲，推荐给你

二：如何定义用户对某首歌曲的喜爱程度呢？
核心思路：通过用户的行为，来定义这个喜爱程度。给每个行为定义一个得分，得分越高表示喜爱程度越高
方案：如果把每个人对每首歌曲的喜爱程度表示出来，这样某个人对某首歌曲是否喜爱，不再用“1”或者“0”来表示，而是对应一个具体的分值。

三：有了用户对歌曲的喜爱程度的对应表之后，如何来判断两个用户是否口味相似呢？
不能在使用简单的计数来统计两个用户之间的相似度，需要使用另一个工具：欧几里得距离，来进行相似度度量

欧几里得距离（Euclidean distance）
欧几里得距离是用来计算两个向量之间的距离的。这个概念中有两个关键词，向量和距离
类比一维、二维、三维的表示方法，K 维空间中的某个位置，我们可以写作（ X
1
， X
2
， X
3
，…， X
K
）。这种表示方法就是向量（vector）。
那如何计算两个向量之间的距离呢？
这个计算公式就是欧几里得距离的计算公式：

我们把每个用户对所有歌曲的喜爱程度，都用一个向量表示。我们计算出两个向量之间的欧几里得距离，作为两个用户的口味相似程度的度量。2. 基于相似歌曲做推荐

一：如何判断两首歌曲是否相似呢？
对于计算机来说，判断两首歌曲是否相似，需要通过量化的数据来表示。
二：应该通过什么数据来量化两个歌曲之间的相似程度呢？
方案一：
对歌曲定义一些特征项，计算每个歌曲的一个特征项向量。基于特征项向量计算两个歌曲之间的欧几里得距离。欧几里得距离越小，表示两个歌曲的相似程度越大。
但是，这个方案需要能够找到足够多，并且能够全面代表歌曲特点的特征项，
除此之外，还要人工给每首歌标注每个特征项的得分，工作量巨大
此外，人工标注有很大的主观性，也会影响到推荐的准确性

方案二：
如果喜欢听的人群都是差不多的，那侧面就可以反映出，这两首歌比较相似。每个用户对歌曲有不同的喜爱程度，依旧通过上一个解决方案中定义得分的标准，来定义喜爱程度。

这个与基于相似用户推荐中的图几乎一样。只不过这里把歌曲和用户主次颠倒了。
基于相似用户的推荐是针对每个用户，将对各个歌曲的喜爱程度作为向量。
基于相似歌曲的推荐思路中，针对每个歌曲，将每个用户的打分作为向量。

有了每个歌曲的向量表示，通过计算向量之间的欧几里得距离，来表示歌曲之间的相似度总结引申
实际上，这个问题是推荐系统（Recommendation System）里最典型的一类问题。算法的强大之处，利用简单的向量空间的欧几里得距离，就能解决如此复杂的问题。
实践中遇到的问题还有很多，比如冷启动问题，产品初期积累的数据不多，不足以做推荐等等