关键字:
- MongoDB
- 情感分析
- 协同过滤推荐
- 评测PRF
架构思路:
要有一个情感分析器,输入一段文字给出正向or负向的评分。
在判断用户A是否喜欢物品b的时候,要根据物品b所拥有的其他用户对其的打分&评论,计算A喜欢物品b的概率,即对计算P(A,b)的公式进行改进。
在P中有个权重参数,如果用户A真的喜欢b,作为正例,设为1;如果不喜欢,设为b,调整参数。
目的:找到一个参数,决定对一个物品的描述应该如何结合打分和评论。也就是,讨论评论应该占多少的数目。
难点:
- 包含评论的数据集很难
- 对英文进行情感分析
- 对推荐的评测
数据描述:
来源:http://jmcauley.ucsd.edu/data/amazon/?spm=5176.100239.blogcont69165.11.Sp505Y
数据格式:
- reviewerID: - ID of the reviewer, e.g. [A2SUAM1J3GNN3B]
- asin - ID of the product, e.g. [0000013714]
- reviewerName - name of the reviewer
- helpful - helpfulness rating of the review, e.g. 2/3
- reviewText - text of the review
- overall - rating of the product
- summary - summary of the review
- unixReviewTime - time of the review (unix time)
- reviewTime - time of the review (raw)
类
- user类
- product类
网友评论