随着时代的发展和技术的进步,深度卷积神经网络(DCNN)在图像分类和识别上取得了很显著的提高。从2014到2016年,先后涌现出了9种目标检测方法,分别为R-CNN,Fast R-CNN, Faster R-CNN, ION, HyperNet, SDP-CRC, YOLO,G-CNN, SSD等,这9种方法一次更替,逐步优化,运行速度得到逐步提升、准确率也有很大改进。
一、基于Region Proposal的方法
基本思想:先得到候选区域再对候选区域进行分类和边框回归。
1.R-CNN
1、是较早地将DCNN用到目标检测中的方法。
2、中心思想:
- 通过selective search 获取候选框(一般一个图形中得到大约2000个大小不同、类别不同的候选区域);
- 用DCNN进行特征提取;
- 使用SVM分类器进行分类,得到一个初略的检测结果;
- 再次使用DCNN获取特征,并结合SVM回归模型得到更加精确的
边界框。
3、selective search的具体流程如下:
selective Search
4、R-CNN 流程
R-CNN 目标检测过程R-CNN 流程图
5、R-CNN 实现流程
R-CNN 实现流程
6、CNN结构和精度
CNN结构来源于AlexNet ,已经在ImageNet数据集上的1000个类别的分类任务中训练过,通过微调参数来完成21个类别的分类。
在VOC 2011 的测试数据集上的检测精度为:71.8%。
7、缺点:1,训练和测试过程分为好几个阶段:得到候选区域,DCNN 特征提取, SVM分类、SVM边界框回归,训练过程非常耗时。2,训练过程中需要保存DCNN得到的特征,很占内存空间。3, 测试过程中,每一个候选区域都要提取一遍特征,而这些区域有一定重叠度,各个区域的特征提取独立计算,效率不高,使测试一幅图像非常慢。
网友评论