美文网首页
小白AI:VOC数据集史上最实用的介绍和使用(1)

小白AI:VOC数据集史上最实用的介绍和使用(1)

作者: 小白学AI | 来源:发表于2020-06-28 15:58 被阅读0次

    这是数据集系列文章的第一篇,后续会陆续介绍COCO数据集,OpenImage数据集等。这里的数据集介绍以及使用都是笔者实际使用和验证过的,保证是可用的。最重要的是,笔者希望大家不仅能知其然还能知其所以然,不是简单的生搬硬套,而是理解很多操作背后的一些东西。所以对每一部分,笔者都会简明扼要的评析原理。我们不追求面面俱到,我们的宗旨是[小而美]

    1.什么是VOC数据集?

    PASCAL VOC挑战赛 (The PASCAL Visual Object Classes )是一个世界级的计算机视觉挑战赛, PASCAL全称:Pattern Analysis, Statical Modeling and Computational Learning,是一个由欧盟资助的网络组织。http://host.robots.ox.ac.uk/pascal/VOC/

    简言之,VOC是 (Visual Object Classes)的简称,它是一套检测和识别标准化的数据集,可以说是该类数据集的开山之作,

    后续的很多数据集,都是在此基础上的扩展。目前应用最广的是VOC 2007和VOC 2012,即在2007推出的VOC和2012年推出的

    VOC版本。在官网上,可以看到这一段话,感觉悲伤逆流成河:

    翻译过来就是:“VOC 挑战赛,起于2005,止于2012,我们很遗憾的通知大家,VOC系列终结了....”

    【评析】:根据笔者的经验,目前学术界主流是在COCO(另外一个数据集,后面会介绍)数据集上验证模型,已经很少有在VOC数据集上验证了。可以说VOC已经对state-of-the-art的模型不构成挑战了。但是VOC是不是没有必要学习了呢?其实不然。一方面VOC作为第一代的数据集,数据量不大,所以很快可以下载上手;另外训练自己的检测器或者是分类器的时候,制作VOC格式数据集还是比较方便。

    2.如何下载?

    我相信大家肯定很关心如何下载,毕竟笔者说了这么多,对于大家来说不过是空中楼阁,水中月镜中花,看不见摸不着,其实笔者也大家一样,遇到新的模型或者是代码,也是第一时间上手感受一下。【Talk is cheap, Show me your code】

    2.1 第一种下载方式:国外官网链接

    $ wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar

    $ wget http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar

    $ wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar

    2.2第二种下载方式:百度网盘

    相信很多人和笔者一样,在国外站点下载备受折磨。为了让后来者不在这方面浪费时间,笔者已经将很多的数据集放在了百度网盘,有的数据集很大,有500G。

    链接:百度网盘

    提取码:n36p

    网速良好的话,很快就能将数据集下载到本地。下一篇文章,笔者会介绍VOC数据集以及怎么使用VOC。和目前很多胡乱抄袭转载的文章不同,笔者会以图文并茂的形式,将整个流程娓娓道来,保证大家看完之后,就能掌握VOC数据集。另外笔者还会介绍自己训练模型中的一些经验和教训,这也是其他同类文章所不具备的,笔者认为,数据集和训练是一个有机的整体,而很多的文章只是机械的将两者分开介绍,不成体系。

    相关文章

      网友评论

          本文标题:小白AI:VOC数据集史上最实用的介绍和使用(1)

          本文链接:https://www.haomeiwen.com/subject/mhojlxtx.html