Top-K Off-Policy Correction for a REINFORCE Recommender System
- WSDM 2019
- google的文章
- 用的强化学习,做的YouTube视频推荐
- 怎么从大量的日志隐式反馈(logged implicit feedback,e.g., user clicks, dwell time)训练强化学习?
- 日志有biases,就是这些记录都是之前版本的推荐系统选择出来的
Social Attentional Memory Network: Modeling Aspect- and Friend-level Differences in Recommendation
- WSDM 2019
- 清华的文章
- 社交关系用户建模
- 主要解决user的friend关系有两个点
1)user与friend只有某些方面相似(用Memory network建模)
2)user与多个friend的相关度不一样(用Attention建模) - Memory network部分(Aspect-level):首先join user与某个friend的Embedding,得到joint embedding,Memory matrix也与friend Embedding join一下,然后用joint Embedding对joint Memory matrix做Attention,得到这个friend的表示
- Attention部分(Friend-level):用user Embedding和item Embedding对每个friend表示做Attention,用来和user Embedding相加得到user表示
- 用BPR loss优化:
- 用的三个公开数据集:Delicious,Ciao,Epinions
The Influence of Image Search Intents on User Behavior and Satisfaction
- WSDM 2019
- 清华的文章
- 分析用户行为和满意度对图片搜索意图的影响
- 做了field study (collected relatively large amount of practical search behavior data with extensive first-tier annotation from users)
- Field Study过程:通过安装浏览器扩展收集用户日志记录,然后用户填写问卷,最后由外部评估人员整理问卷,得出用户意图的why(为什么用户要搜索这个)和what(用户想要搜索什么)
- 用户不同的搜索意图类型怎么影响用户行为?why影响较大,what影响不明显
- 哪些因素影响用户的满意度?相关性影响最大,然后是质量,多样性和源网站
- 用户行为信号(click,mouse movement,explicit feedback)对用户搜索满意度预测的表现怎样?
Recurrent Marked Temporal Point Processes: Embedding Event History to Vector
- KDD'2016
- 点过程对事件建模
- 用RNN模拟每个时刻的点过程强度
网友评论