CG:cumulative gain,累积获得,指的是网页gain的累加。gain可以使自己定义的一种获得,用来衡量网页的相关性程度。CG@p : 就是topP 的gain的累加。
CGDCG:Discounted Cumulative Gain
Discounted的factor为:Log(2)/Log(1+rank)
IDCG:
对于搜索引擎,本质是用户搜一个query,引擎返回一个结果列表,那么如何衡量这个结果列表的好坏?
1. 最相关的结果最靠前 2. 整个列表的结果尽可能和query相关
为了满足2, gain即是每条结果的质量的定义,NDCG把所有结果相加最终相加保证,整体质量越高的列表NDCG值越大。为了满足1,Discounted的设计使得越靠前的结果权重越大。
网友评论