美文网首页深度学习
【Tensorflow】Object Detection API

【Tensorflow】Object Detection API

作者: 下里巴人也 | 来源:发表于2017-12-08 15:43 被阅读1050次

工具来源:https://github.com/whlook/VOCMaker.git

1. VOC数据集包含内容

VOC数据集,包含以下几个文件夹:

  • Annotations (存放每个对象xml格式的标签)
  • ImagesSets(包括action layout main segmentation四个部分的内容,是数据集中每一种类型图片的信息。main下存放的是图像物体识别的数据,总共分为20类。)
  • JPEGImages(所有jpg图片,包括训练图片和测试图片。)
  • SegmentationClass(标注出每一个像素的类别)
  • SegmentationObject(标注出每一个像素属于哪一个物体)

2. 如何制作自己的VOC数据集

2.1 准备照片素材

比如,我有4类素材:可口可乐、味全、统一方便面、青岛纯生
总共97张图片。

2.2 标注每张图片

依赖:

  • Windows10系统
  • python 2.7.14
  • opencv3.0
  • vs2015
  • python numpy库
  • VOCMaker源码

2.2.1 安装python 2.7.14

  • 官网下载安装python 2.7.14 ,比如我安装到C:\Python27目录
  • 添加python 环境变量,打开系统环境变量,Path变量添加:C:\Python27;C:\Python27\Scripts;

2.2.2 安装numpy库

打开cmd,执行:

pip install numpy


2.2.3 安装opencv3.0

安装、编译参考
安装、编译完成后,要把opencv-3.0\opencv\mybuild\install\x86\vc14\bin目录下所有的动态库,拷贝到VOCMaker-master\VOCMaker\Debug目录下;
把opencv-3.0\opencv\build\python\2.7\x64\cv2.pyd拷贝到VOCMaker程序运行目录。

2.2.4 VOCMaker

下载地址:https://github.com/whlook/VOCMaker
打开工程,注意配置工程的openCV依赖库和头文件路径。

2.2.5 重命名图片

将原始图片都放到:VOCMaker-master\VOCMaker\VOCMaker\imgs目录下,如图所示:

在master\VOCMaker\VOCMaker\目录下,执行:

python rename.py

会在当前目录下生成JPEGImages文件夹,并把原始图片统一重命名为以下:

运行程序,框住要识别的物体,填写标签:

按空格键,切换到下一张照片。

当操作完最后一张图片时,按o键,生成xml标签信息。

所有标签信息录入完毕后,执行:

python txt.py

3. 其他工具介绍

https://github.com/puzzledqs/BBox-Label-Tool

4. 程序下载

程序我打包了有需要可以Q我。qq号:479066524

相关文章

网友评论

  • 只有香如故:楼主,运行程序,框住要识别的物体,填写标签。这一步怎么运行程序?
  • 阿嘉_c850:你好,我想问一下。你的数据集里面你有区分训练集和测试集吗
    如果区分了,是放到两个文件夹里面吗
    下里巴人也:@阿嘉_c850 不用放两个文件夹,放一个文件夹,用train.txt和test.txt区分就行了
    下里巴人也:@阿嘉_c850 这个都可以在record脚本自己指定的。 我是放在一起。 VOC/ImageSets/Main/里面train.txt和test.txt有指定训练集和测试集的素材的。
  • 赵小闹闹:作者你好,我想咨询一下xml文件中的folder和filename对应的内容需要和图片对应么?比如一张图片是00001.jpg,对应的xml文件名字是00001.xml,但是xml文件中的folder和filename是之前别人标的,运行脚本后抱的错误是‘tensorflow.python.framework.errors_impl.NotFoundError: ./VOCdevkit/VOC2018/JPEGImages/16-45; No such file or directory’
    但是并没有16-45这张图片。
    下里巴人也:@赵小闹_da42 xml中的filename和folder 取决于你生成tf_record生成脚本怎么用。

本文标题:【Tensorflow】Object Detection API

本文链接:https://www.haomeiwen.com/subject/mjqeixtx.html