文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。
作者&编辑 | 言有三
01
美学评分
美学质量的评估是 AI 与摄影学交叉的学科,也是目前比较 open 的问题。
究竟什么是图像美学质量呢?牛津高阶英语词典将美学定义为:“concerned with beauty and art and the understanding of beautiful things, and made in an artistic way and beautiful to look at”。
视觉美学质量是视觉感知美的一种度量。图像的视觉美学质量衡量了在人类眼中一幅图像的视觉吸引力。由于视觉美学是一个主观的属性,往往会涉及情感和个人品味,这使得自动评估图像美学质量是一项非常主观的任务。然而,人们往往会达成一种共识,即一些图像在视觉上比其他图像更有吸引力,这是新兴研究领域——可计算美学的原理之一。计算美学探索如何用可计算技术来预测人类对视觉刺激产生的情绪反应,使计算机模仿人类的审美过程,从而用可计算方法来自动预测图像的美学质量。
在现实生活中,图像美学质量评价可以用于基于美学的图像搜索,自动图像增强,自动构图等应用。
美学评分
AVA
AVA 是一个美学质量评估的数据库,包括 250000 张照片。每一张照片,都有一系列的评分,以及语义级别的label,其中语义级别的 label 共 60 类,同时还有 photographic style,即照片的风格,共 14 类。
AVA 仍然是现今较大的数据集,包含 250000 张图片的美学分数和语义标注。每一张图的标注人员的数量从 78~549,不止包括了专业的图像工作者,摄影师,也包括了摄影爱好者,这样显得更有普适性,平均一张图约有 210 个标注。
标注的分数为 0~9,分值越高,说明图片质量越高。下面展示了各个分值的标注情况,可以看出标注结果还是很一致的。
除了美学分数之外,还包含了语义标注,共包含了 66 个类。大概有 200000 张图只包含一个 tags,150000 张图包含 2 个 tags。哪些 tags 最多呢,作者们也作出了一个统计如下:
这是研究 AI 美学必备的数据集,而且网上很难找到下载,笔者曾经花了一个月才下下来,希望大家喜欢,勿要传播。
02
颜值评分
颜值评分属于一个比较主观的任务,五官匀称,轮廓对称,肤色美观的脸更容易受到大众的喜欢,这一点在颜值中是有一定共识的,也就是“丑人多作怪,美人一个胚”。正因如此,颜值算法才有了可行性,因此国内各大公司都开发了颜值打分应用。
总的来说,颜值和肤色,脸型,装饰等都有很大的关系。研究方向可以从传统算法和深度学习方法两个方向讲述。
传统方法主要基于人脸距离,面积等特征,以脸型为主,深度学习则直接进行数据标注后从中学习。
颜值评分
SCUT-FBP5500
这是一个人脸颜值数据集,共 5500 个正面人脸,其中 4000 个亚洲人脸,评分为 0~5 分。
数据集地址:
https://github.com/HCIILAB/SCUT-FBP5500-Database-Release
包含了共 5500 个自然表情下的正面人脸,年龄分布为 15-60。它包含不同的性别分布和种族分布(2000亚洲女性,2000 亚洲男性,750 高加索男性,750 高加索女性)。每一张图由 60 个人进行评分,共评为 5 个等级,这 60 个人的年龄分布为 18~27 岁,均为年轻人。这是第一个比较通用的人脸颜值数据集,每一个图都提供了 86 个关键点的标注。
03
自拍评分
拥有人脸的图像往往更容易收到评论和点赞,其中自拍占据了很大一部分。AI 老司机 Google 早就开发了一个自拍 APP 进行相关的探索,名为 Selfissimo,对此感兴趣的你不妨一试。究竟你的脸是仰角 45 度好呢还是侧 30 度好,如果没把握就交给 AI 去搞定吧。
自拍评分
Selfie
你的自拍能打几分,这是一个没有答案但是又很有实践意义的问题,selfie 就是这样的一个自拍数据集,包括 46000+ 图片,36 种属性。
作者们从selfeed.com网站上收集了46,836 张自拍图,然后标注了36 种属性,分为以下类别:
性别: is female.
年龄: baby, child, teenager, youth, middle age, senior.
种族: white, black, asian.
脸型: oval, round, heart.
脸部表情: smiling, frowning, mouth open, tongue out, duck face.
头发颜色: black, blond, brown, red.
发型: curly, straight, braid.
装饰: glasses, sunglasses, lip- stick, hat, earphone.
其他.: showing cellphone, using mir-ror, having braces, partial face.
光照条件: harsh, dim.
各个属性的正负样本分布如下:
到底什么样的照片更容易收到欢迎呢?各个属性与受欢迎程度的关系图如下:
维度非常之广,很适合做相关研究,下面是图片预览。
如果你想试试利用算法来提高自己的颜值,不如来试试这个数据集吧!
星标我,每天多一点智慧
网友评论