这是数据集系列文章的第一篇,后续会陆续介绍COCO数据集,OpenImage数据集等。这里的数据集介绍以及使用都是笔者实际使用和验证过的,保证是可用的。最重要的是,笔者希望大家不仅能知其然还能知其所以然,不是简单的生搬硬套,而是理解很多操作背后的一些东西。所以对每一部分,笔者都会简明扼要的评析原理。我们不追求面面俱到,我们的宗旨是[小而美]
1.什么是VOC数据集?
PASCAL VOC挑战赛 (The PASCAL Visual Object Classes )是一个世界级的计算机视觉挑战赛, PASCAL全称:Pattern Analysis, Statical Modeling and Computational Learning,是一个由欧盟资助的网络组织。http://host.robots.ox.ac.uk/pascal/VOC/
简言之,VOC是 (Visual Object Classes)的简称,它是一套检测和识别标准化的数据集,可以说是该类数据集的开山之作,
后续的很多数据集,都是在此基础上的扩展。目前应用最广的是VOC 2007和VOC 2012,即在2007推出的VOC和2012年推出的
VOC版本。在官网上,可以看到这一段话,感觉悲伤逆流成河:
翻译过来就是:“VOC 挑战赛,起于2005,止于2012,我们很遗憾的通知大家,VOC系列终结了....”
【评析】:根据笔者的经验,目前学术界主流是在COCO(另外一个数据集,后面会介绍)数据集上验证模型,已经很少有在VOC数据集上验证了。可以说VOC已经对state-of-the-art的模型不构成挑战了。但是VOC是不是没有必要学习了呢?其实不然。一方面VOC作为第一代的数据集,数据量不大,所以很快可以下载上手;另外训练自己的检测器或者是分类器的时候,制作VOC格式数据集还是比较方便。
2.如何下载?
我相信大家肯定很关心如何下载,毕竟笔者说了这么多,对于大家来说不过是空中楼阁,水中月镜中花,看不见摸不着,其实笔者也大家一样,遇到新的模型或者是代码,也是第一时间上手感受一下。【Talk is cheap, Show me your code】
2.1 第一种下载方式:国外官网链接
$ wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
$ wget http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
$ wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar
2.2第二种下载方式:百度网盘
相信很多人和笔者一样,在国外站点下载备受折磨。为了让后来者不在这方面浪费时间,笔者已经将很多的数据集放在了百度网盘,有的数据集很大,有500G。
链接:百度网盘
提取码:n36p
网速良好的话,很快就能将数据集下载到本地。下一篇文章,笔者会介绍VOC数据集以及怎么使用VOC。和目前很多胡乱抄袭转载的文章不同,笔者会以图文并茂的形式,将整个流程娓娓道来,保证大家看完之后,就能掌握VOC数据集。另外笔者还会介绍自己训练模型中的一些经验和教训,这也是其他同类文章所不具备的,笔者认为,数据集和训练是一个有机的整体,而很多的文章只是机械的将两者分开介绍,不成体系。
网友评论