文章地址。[1907.00516] Learning to Blindly Assess Image Quality in the Laboratory and Wild
这篇主要解决的问题是不同dataset之间subjected-rate的评价scale不一致的问题,众所周知图像质量评价的数据库一般是由[图像-主观评价标签]这种形式构成的,主观评价标签一般是MQS(mean quality score),大概操作方法可能就是搞了很多人来给图片打分最后取个平均分啥的,但是由于不同数据库构建的时候采取的打分标准不一样,比如有的是百分制,有的是五分制啦,或者告诉参与者的打分标准不一样,这些数据不能一起用于训练。本来图片质量评估这块数据就少,train的效果和dataset又息息相关。
主要思路也很简单,抛弃原来的scores,只保留ranking信息,对j个数据库分别做pairs sampling,用二值标签标记这些pairs来表明rank。就是说虽然原来做的那些subjected test有不同的scale,我们不能采用他们打的分,但是rank信息却是可靠的,一个pairs里哪张图好哪张图不好我们是可以确定的。我们现在需要做的是,寻找一个依赖于参数组ω的函数Fω(x),它把输入图片x转化成一个表示标准感知质量的scalar,而且根据这个函数的转化结果与我们不同pairs里面的ranking标签有最大似然。在这个图片→感知质量转化器之下,最有可能实现我们的这些ranking分布。
核心想法就是不直接利用主观评价的分数,而是利用主观评价的ranking,这样就可以利用不同dataset里的数据。
网络结构也很简单。输入结构是(x,y,r),同一个数据库里的两张图片以及他们的二值ranking。网络框架是ResNet-34,优化方法是Adam(其实就是Momentum+RMSProp的结合,然后再修正其偏差。 ),Loss函数用的是交叉熵。
网友评论