美文网首页
KB4Rec:ADatasetforLinkingKnowled

KB4Rec:ADatasetforLinkingKnowled

作者: CherrySSS | 来源:发表于2018-10-26 17:40 被阅读0次
  • 构建一个开放的linked KB(knowledge base)数据集用于推荐系统(RS):knowledge-aware recommender systems

    • Freebase,将事实存储为三元组⟨head,relation,tail⟩.使用的是2015年3月的版本【目前为最新发布的版本】
  • RS选用三个广泛使用的数据集

    *   MovieLens->movie
    
    *   LFM-1b->music
    
    *   Amazon book->book
    
  • Related work for knowledge-aware recommender systems

    • 第一阶段

      • context-aware recommendation algorithms,利用社交信息【Epinions数据集】、POI属性信息【Yelp数据集】、电影属性信息【MovieLens数据集】、用户档案信息【Microblogging数据集】..

      • 利用原始RS平台的辅助信息(上下文数据)做推荐,这些数据往往辅助信息种类少,且辅助信息间关系relation patterns被忽略了

    • 第二阶段

      • HIN: ,Heterogeneous InformationNetworks,能有效学习relation patterns

      • 依赖图搜索算法,很难处理大规模关系查找

    • 第三阶段

      • KB,用于组建只是和领域事实

      • 通过连接RS items和KB entities,但现有文献使用的均为private KB,无法获取

  • 如何构建RS到KB的连接(Linkage):

    • 通过调用离线Freebase search API,用item titles作为queries,检索KB entities

    • 如果没有KB entity返回,说明RS item在linkage process被拒绝了

    • 如果至少一个KB entity返回,使用一种辅助信息作为准确连接间的一种精确的约束。e.g. IMBD ID,artist name and writer name are used for the three domains of movie, music and bookrespectively

  • Linkage ratio和哪些因素可能有关?

    • KB的构建经常包含人力工作,无法忽视人类注意力的偏差

    • 流行度,成正相关,即item越流行,Linkage ratio可能越高

    • 新颖度,成负相关,即item发布时间越晚,Linkage ratio可能越低

  • KB4Rec数据集的使用,选用哪些推荐算法进行试验,性能指标选取:

    • 指标:

      *   MRR:mean reciprocal rank
      
      *   HR: hit ratio
      
      *   NDCG: normalized discounte cumulative gain
      
    • 推荐算法:

      • 与文献【7】相似,采用last-item recommendation task for evaluation

      • 算法:

        *   BPR
        
        *   SVDFeature
        
        *   mCKE:第一篇文献提出利用KB和其他信息来提高推荐性能
        
        *   KSR:Knowledge-enhanced Sequential Recommender,利用KB信息提高语义表示memory networks的性能【结果最好】
        
  • KB4Rec数据集地址

相关文章

网友评论

      本文标题:KB4Rec:ADatasetforLinkingKnowled

      本文链接:https://www.haomeiwen.com/subject/cssltqtx.html