-
构建一个开放的linked KB(knowledge base)数据集用于推荐系统(RS):knowledge-aware recommender systems
- Freebase,将事实存储为三元组⟨head,relation,tail⟩.使用的是2015年3月的版本【目前为最新发布的版本】
-
RS选用三个广泛使用的数据集
* MovieLens->movie * LFM-1b->music * Amazon book->book
-
Related work for knowledge-aware recommender systems
-
第一阶段
-
context-aware recommendation algorithms,利用社交信息【Epinions数据集】、POI属性信息【Yelp数据集】、电影属性信息【MovieLens数据集】、用户档案信息【Microblogging数据集】..
-
利用原始RS平台的辅助信息(上下文数据)做推荐,这些数据往往辅助信息种类少,且辅助信息间关系relation patterns被忽略了
-
-
第二阶段
-
HIN: ,Heterogeneous InformationNetworks,能有效学习relation patterns
-
依赖图搜索算法,很难处理大规模关系查找
-
-
第三阶段
-
KB,用于组建只是和领域事实
-
通过连接RS items和KB entities,但现有文献使用的均为private KB,无法获取
-
-
-
如何构建RS到KB的连接(Linkage):
-
通过调用离线Freebase search API,用item titles作为queries,检索KB entities
-
如果没有KB entity返回,说明RS item在linkage process被拒绝了
-
如果至少一个KB entity返回,使用一种辅助信息作为准确连接间的一种精确的约束。e.g. IMBD ID,artist name and writer name are used for the three domains of movie, music and bookrespectively
-
-
Linkage ratio和哪些因素可能有关?
-
KB的构建经常包含人力工作,无法忽视人类注意力的偏差
-
流行度,成正相关,即item越流行,Linkage ratio可能越高
-
新颖度,成负相关,即item发布时间越晚,Linkage ratio可能越低
-
-
KB4Rec数据集的使用,选用哪些推荐算法进行试验,性能指标选取:
-
指标:
* MRR:mean reciprocal rank * HR: hit ratio * NDCG: normalized discounte cumulative gain
-
推荐算法:
-
与文献【7】相似,采用last-item recommendation task for evaluation
-
算法:
* BPR * SVDFeature * mCKE:第一篇文献提出利用KB和其他信息来提高推荐性能 * KSR:Knowledge-enhanced Sequential Recommender,利用KB信息提高语义表示memory networks的性能【结果最好】
-
-
网友评论