这一步是计算CoOccurrence Matrix的Mapping。
Input是 userID, 以及a list of 他评分过/看过的电影。
然后遍历这一串电影,两两为key,output 1. 【用来建立两两电影间关系】
这一步用来reduce。reduce的结果就是两两Movie之间:movie A: movieB : <1,1,,1,1,1,1,1,1>
有多少人同时看了这两部电影
Normalize出来的是一个占比。就是M1 和 其他电影之间的关系。Relations?
这样用户A给出他对所有电影rating的时候,可以知道每项的占比影响。
CoOccurrence * Rating = predicted rating
对M1, M2, M3, M4, M5 rows分别multiply by Rating by user B. 选Top one recommend
网友评论