
这里两个矩阵,分别是用户和标签的关系,电影和标签的关系。
我们得到两张表,也可以理解两个矩阵,一个是电影和标签,一个是用户和标签,电影和标签通过数据来表示电影和标签的关系。

通过这两个矩阵我们可以得出用户和电影的关系,我们如何看 Ana 对 M1 喜欢的程度,之前已经介绍过我们忽略不喜欢的标签的评分所以是 3

再看一看 betty 对 M1 喜欢程度为 1

而 Dana 既喜欢动作又喜欢喜剧所以是 4。


我们通过这两个推荐矩阵就可以得出用户和电影的矩阵如右侧的图





M1 和 M4 具有相同的评分。所以两部电影为相同


从图中可以看出 D 是 B 和 C 的和

M2 和 M3 的平均值为 M5 的值。说了这么多就是为了说明这两个矩阵可以代替用户和电影关系的矩阵,


需要矩阵来描述用户对电影的关系,需要一个数组 1000 * 2000 的数组。通过这样一个数组来描述用户喜欢电影的关系。

这样一来数据量达到了 2M 。

用推荐矩阵好处是可以减少数据量,用两个数据数组来替换那个大数组,也能起到同样作用,好处通过两个矩阵就来提到同样效果。这样大大减少数据量。

我们通过用两个矩阵来定位,获取矩阵块,所以这两个推荐矩阵可以得出同样效果。

有的人喜欢看图来理解一些概念,我们可以通过图形来表示关系。我们用图来表示用户和电影的关系。

我们用标签将两者,用户和电影,串起来的,然后表示用户和电影间的关系。

对比一下两个,可以很明显右侧的图中关系线相对减少多了。


我们在此从数据考察一下,2000 * 1000 = 2M

再看一看这张图,从数据上看也少了很多。
网友评论