作者以及单位
Vargas, 马德里自治大学 (西班牙)QS200名
解决问题
提出了一个框架,解决三者之间的关系,被选择,新颖,多样性。
研究对象
具体来说,这个问题是通过设计新的指标“metrics”来调整推荐物品排序的相关性。这个新指标考虑了用户的关注、用户的主观等。关注,主观的理解是:只要是用户不喜欢,无论多客观算出的多样性都不会带来排序的增加。
研究方法
核心框架(新颖性模型+浏览行为模型):
Discovery 用于定义新颖性(novelty)模型的基础。
Choice建立推荐item列表上的用户浏览行为模型。
然后这个浏览行为模型和新颖性模型就为新的metrics提供了广泛的多样性和新颖性。
p(choose)表示用户浏览的模型,noe表示新颖模型。C表示归一化的常数,cita表示实例化变量,可以同时考虑新颖性和多样性。i,u,R分别表示用户u准备选择i项目的时候推荐系统推荐R列表选择。其中新颖性的计算核心是:凡是用户没有见过的seen就标为0,反之为1.然后在下面这个公式上乘以一个相似度距离(原文用的是协同过滤)得到了新颖性的计算结果。
初始模型
下面对两个核心实现分别介绍一下:
首先是新颖性:定义的比较有趣,新颖就是平时看不到的。所以新颖性+可以看到的=1.当然这个可能比较线性,文章后面给了若干的log的优化调整,但是主体思想基于以下公式。
novelty
其次是浏览模型是一个级联模型(cascade),主要是ranking的排序。k表示用户决定是否继续的ranking的位置,cont是一个布尔类型。p(cout|k,u,R)表示用户u决定是否浏览k+1的可能性。
浏览模型
原文有句话说的挺高级,如何把别人的工作进入进来:Our approach takes inspiration in related work on user click models in xxx [cite paper], but any other alternative modeling approach could be plugged into our framework.
核心整合,将多样性和新颖性结合推荐度量,文章提出了3个公式(3个度量的侧重点),分别是EPC(expected popularity complement) EPD()和EILD(expected intra-list distance).我决定三个定义其实是类似的,一个想法的3个不同表达形式。主要是EPC,核心可以看到以前算法没有推荐的结果.
EPD
EILD
测试也很有意思,作者除了用movielens等数据集,自己设计了一个数据集,其中r(u,i)=1表示用户真正喜欢,0就表示不喜欢,rates可以理解为点赞,或者加心都行,越高表示这个项目越火。那么例举了R1和R2两个表。
自定义数据集
作者想表达的意思是,一般的推荐系统会推荐R1(又火又喜欢),而好的推荐系统应该推荐R2(又多样性又新颖又喜欢),喜欢是用1表示的,两个表1的数量都一样,那么推荐的应该rates应该比较少,会更新颖一些。
结果表明用了该算法的,R2的得分高一些。
评测
文章还做了其他测试,例如相关性relevant和排序rank的敏感性,就是用了这个方法有没有什么副作用,我感觉很重要,这里只列举主要矛盾就不例举细节了。
创新点
度量的方案是基于发现item的距离为核心。文章提出了choice, discovery and relevance三个核心。在这三个核心的基础上,通过概率推荐模型来调整item的排序和相关性。
1.除了top的指标外,此框架衡量了推荐的ranking,无论是前面还是后面都考虑多样性的排名。
2.此框架衡量了relevant,严格关注新颖性和多样性。评估方法同时考虑这两者,而又不是简单的相等考虑。
结论
1.在以前的metrics基础上提出了可以度量的推荐新颖性和多样性。而且衍生性比较好(因为是级联模块化)。
2.新颖性和多样性测量中提出了两个新颖的features:排序敏感性和相关性认知rank sensitivity, and relevance awareness。
3.未来工作写的特别详细,把本文新颖性和多样性的设计作为媒介,融入到默认的基础模型中。(我理解就是未来大家设计的算法,通过本模型接口转换一下,就可以提高多样性和新颖性性能)In addition to the provision of evaluation tools, the underlying models can be used to build objective functions for novelty and diversity enhancement methods, taking the ratings predicted by baseline recommenders as a proxy of true relevance.
网友评论