缘由
国庆期间,想对物体检测模型挨个撸一遍,最后发现这是一个极其困难的操作。大神发的论文大都是以python2,caffe等框架。本人有一个大胆的想法,就是直接改object_detectionAPI源码。浑浑噩噩看了几天发现,有点难度,资料不好找(输入的关键词不给力)。终于!!!在Google时发现有大神已经把笔记发在博客上了,给了我等小白一个喘气之机。
这是Faster RCNN的流程图,这篇博客主要是按照这个流程进行推进。
按照学习路线,先看谷歌的这里的入门文档,所有文档看了之后再说吧!
以下翻译内容是(百度+谷歌+自编):
1.challenge_evaluation.md
说的是使用Open Images Challenge 2018数据集对你的模型进行评估,告诉你怎么在把数据变成合适的格式,然后使用你的模型进行推断,之后有个评分器对你的推断数据进行评估,好像没什么帮助啊。
2.using_your_own_dataset.md
这篇是就是介绍怎么把自己的数据制作成为tfrecord的数据,之后可以进行训练,tfrecord数据可以进行队列,混洗等操作。官方的API都是读取tfrecord数据的。
3.configuring_jobs.md:
总体介绍了一下配置文件,这里的配置文件分为5大块,需要具体讲一讲:见object_detectionAPI源码阅读笔记(1-翻译configuring_jobs.md)。
在object_detection\protos是分开的配置文件。
在object_detection\samples\configs是把把大块文件合在一起的配置文件。
4.defining_your_own_model.md:
这里文档是在进行深入源码分析之前必看的。介绍了模型的总体结构,主要介绍了几个在object_detection中主要的基类的功能和缘由,具体在它们的源码文件里有具体注解。
包括(DetectionModels,FasterRCNNFeatureExtractor,FasterRCNNMetaArch
)这几个类的介绍。另外比较重要的类SSDFeatureExtractor,SSDMetaArch
这些只能在源码看了。
DetectionModels在:object_detection\core\model.py
FasterRCNNFeatureExtractor在: object_detection\meta_architectures\faster_rcnn_meta_arch.py。SSD类似。
5.detection_model_zoo.md:
这里面有各种pre-trained model下载,从faster rcnn到mask rcnn。
6。其他md
其他的文件看看就好了
更新:
最近读了篇论文,是Google出品,应该就是使用这个API做实验写的论文,这里面讲的比API文档还详细,论文中提到一些概念和 API 有关,有时间可以去看一下:
https://arxiv.org/abs/1611.10012(英文版本)
http://tongtianta.site/paper/252(中文的翻译版本)
后话
看大神们早在[2017-06-18]就对谷歌物体检测API就有评价了,一年之后,我等屌丝还在挣扎。贾扬清的回答直接秒杀我。
Caffe框架的作者--贾扬清--个人主页
特此感谢:
1.知乎:TensorFlow Object Detection API 源码(1) DetectionModel
2.csdn: 王某的博客
3.csdn: Wayne2019
网友评论