本文首发于微信公众号《与有三学AI》
【走向AI摄影终极之路 · 第二篇】 没有AVA数据集的时候,大家用什么?
单刀直入,直接介绍在没有AVA时,大家都用什么数据集来研究摄影美学。
1, http://Photo.net (PN)
PN数据集包含3581张图片,图片均来自于社交网络https://www.photo.net/。每张图片由社交网络的在线用户进行评分,有两个评价分数(0-7分)分别对应图片美学质量和原始质量,每张图片均有两个及以上的用户对其进行评分。而PN数据集则记录了每张图片美学质量和原始质量的均值分数。

示例1:PN数据集里的部分样本
2, CUHK
CUHK数据集包含12000张图片,其中一半为标记为高质量图片,另一半标记为低质量图片。数据集中图片来源与AVA相同,均来源于www.dpchallenge.com,但不同的是,CUHK保留了随机抽选的60000幅图片中均分位于前10%与末尾10%的图片,即对质量有明确共识的那些图片。并且,CUHK仅提供了二分类标签,(1代表高质量,0代表低质量)。所以近期提出算法在该数据集上分类效果正确率均可达到90%以上。

示例2:CUHK数据集中部分样本,其中(a)为高质量图片,(b)为低质量图片。
3, CUHKPQ
CUHKPQ数据集包含17613张图片,分为7个语义类。每张图片都有8-10个人为标注为高质量或低质量的标签,数据集的二分类标签有很强的一致性。因此,与CUHK相同的是,这个数据集用于美学分类的难度并不是很大。实际上,CUHKPQ数据集里高质量的图片是从专业的摄影网上获取,而低质量的图片则是由在校学生提供,所以区别度太大,并不适用于通常意义下的美学判别。

示例3:CUHKPQ数据集里样本,其中上行标记为高质量,下行标记为低质量。
4, MIRFLICKR/Image CLEF: Visual Concept Detection and Annotation Task 2011
MIRFLICKR数据集由Flickr在多媒体检索中选取,包含一百万张图片,每张图片附有文本信息,美学质量标注(Flickr’s interestingness flag)和EXIF元数据。MIRFLICKR的一个子集也用于CLEF (the Cross-Language Evaluation Forum)作为“Visual Concept Detection”的两个挑战。对于这些挑战,基本标注进一步涵盖了情感注释和一些与摄影风格相关的标签。MIRFLICKR是最接近于AVA的一个数据集,但它缺少美学偏好的标注,仅有“interestingness” flag进行描述。44个视觉概念中主要集中于曝光与模糊,只有以下类别可用:自然,照明,曝光过度,曝光不足,运动模糊,无模糊,失去焦点,部分模糊。并且,有类似风格标注的图片数量有限。

附图4:MIRFLICKR数据集里的部分样本
更多请移步
1,我的gitchat达人课
2,AI技术公众号,《与有三学AI》
3,以及摄影号,《有三工作室》
网友评论