【技术综述】在没有AVA之前，大家用什么来研究摄影美学

作者: 有三AI | 来源:发表于2019-01-16 08:12 被阅读8次

【技术综述】在没有AVA之前，大家用什么来研究摄影美学
室内定位技术
【技术综述】人脸颜值研究综述
初识人脸识别
【技术综述】AVA数据集后时代与展望
目标list - 2021年结束之前
AVFoundation-读取和写入媒体
不想走科研弯路?这些经验你得知道
【天光学术】新硕士论文开题需要注意的几个问题
【技术综述】人脸表情识别研究

本文首发于微信公众号《与有三学AI》

单刀直入，直接介绍在没有AVA时，大家都用什么数据集来研究摄影美学。

1， http://Photo.net (PN)

PN数据集包含3581张图片，图片均来自于社交网络https://www.photo.net/。每张图片由社交网络的在线用户进行评分，有两个评价分数（0-7分）分别对应图片美学质量和原始质量，每张图片均有两个及以上的用户对其进行评分。而PN数据集则记录了每张图片美学质量和原始质量的均值分数。

示例1：PN数据集里的部分样本

2， CUHK

CUHK数据集包含12000张图片，其中一半为标记为高质量图片，另一半标记为低质量图片。数据集中图片来源与AVA相同，均来源于www.dpchallenge.com，但不同的是，CUHK保留了随机抽选的60000幅图片中均分位于前10%与末尾10%的图片，即对质量有明确共识的那些图片。并且，CUHK仅提供了二分类标签，（1代表高质量，0代表低质量）。所以近期提出算法在该数据集上分类效果正确率均可达到90%以上。

示例2：CUHK数据集中部分样本，其中（a）为高质量图片，（b）为低质量图片。

3， CUHKPQ

CUHKPQ数据集包含17613张图片，分为7个语义类。每张图片都有8-10个人为标注为高质量或低质量的标签，数据集的二分类标签有很强的一致性。因此，与CUHK相同的是，这个数据集用于美学分类的难度并不是很大。实际上，CUHKPQ数据集里高质量的图片是从专业的摄影网上获取，而低质量的图片则是由在校学生提供，所以区别度太大，并不适用于通常意义下的美学判别。

示例3：CUHKPQ数据集里样本，其中上行标记为高质量，下行标记为低质量。

4， MIRFLICKR/Image CLEF: Visual Concept Detection and Annotation Task 2011

MIRFLICKR数据集由Flickr在多媒体检索中选取，包含一百万张图片，每张图片附有文本信息，美学质量标注（Flickr’s interestingness flag）和EXIF元数据。MIRFLICKR的一个子集也用于CLEF (the Cross-Language Evaluation Forum)作为“Visual Concept Detection”的两个挑战。对于这些挑战，基本标注进一步涵盖了情感注释和一些与摄影风格相关的标签。MIRFLICKR是最接近于AVA的一个数据集，但它缺少美学偏好的标注，仅有“interestingness” flag进行描述。44个视觉概念中主要集中于曝光与模糊，只有以下类别可用：自然，照明，曝光过度，曝光不足，运动模糊，无模糊，失去焦点，部分模糊。并且，有类似风格标注的图片数量有限。