推荐系统实现第2章源码

作者: 数字化转型研学社 | 来源:发表于2016-01-26 19:40 被阅读0次

import math

def UserSimilarity(train):

item_users = dict()

for u,items in train.items():

for i in items:

if i not in item_users:

item_users[i]=set()

item_users[i].add(u)

print item_users

#{'a': set(['A', 'B']), 'c': set(['B', 'D']), 'b': set(['A', 'C']), 'e': set(['C', 'D']), 'd': set(['A', 'D'])}

C = dict()

N = dict()

for i , users in item_users.items():

for u in users:

N.setdefault(u,0)

N[u] += 1

for v in users:

if u == v:

continue

C.setdefault(u,{})

C[u].setdefault(v,0)

C[u][v] += 1

print C

print N

#{'A': {'C': 1, 'B': 1, 'D': 1}, 'C': {'A': 1, 'D': 1}, 'B': {'A': 1, 'D': 1}, 'D': {'A': 1, 'C': 1, 'B': 1}}

#{'A': 3, 'C': 2, 'B': 2, 'D': 3}

W = dict()

for u , related_users in C.items():

for v , cuv in related_users.items():

W.setdefault(u,{})

W[u].setdefault(v,0)

W[u][v] = cuv / math.sqrt(N[u] * N[v])

return W

train={'A':['a','b','d'],'B':['a','c'],'C':['b','e'],'D':['c','d','e']}

F = UserSimilarity(train)

print F

#{'A': {'C': 0.4082482904638631, 'B': 0.4082482904638631, 'D': 0.3333333333333333}, 'C': {'A': 0.4082482904638631, 'D': 0.4082482904638631}, 'B': {'A': 0.4082482904638631, 'D': 0.4082482904638631}, 'D': {'A': 0.3333333333333333, 'C': 0.4082482904638631, 'B': 0.4082482904638631}}

网友评论

本文标题：推荐系统实现第2章源码

本文链接：https://www.haomeiwen.com/subject/owolkttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

推荐系统实现第2章源码

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读