一、什么是目标检测
目标检测的任务是找出图像中所有感兴趣的目标,确定它们的位置和类别。由于各类物体有不同的外观、形状、姿态,加上成像时光照,遮挡等因素的干扰,目标检测一直是计算机使君领域最具有挑战的问题。
图像识别有四大类任务:
分类(Classification): 解决"what"。
定位(Location):解决”where“。
检测(Detection):解决”what & where“。
分割(Segmentation):分为 实例分割(Instance-level)和 语义分割(semantic segmentation)。解决“每一个像素属于哪个实例或哪一类”。
二、核心问题
除了图像分类以外,目标检测要解决的核心问题是:
1、目标可能出现在图像的任何位置。
2、目标有各种不同的大小。
3、目标有各种不同的形状。
则如果用矩形框来定义目标,则矩形框需要有不同的宽高比。由于目标的宽高比不同,因此采用传统的滑动窗口+图像缩放的方案解决通用目标检测问题的成本太高。
三、目标检测算法分类
基于深度学习的目标检测算法主要分为两类:
-
1、Two stage目标检测算法
先进行区域建议框(Region Proposal, RP)的生成,再通过卷积神经网络进行分类。
步骤:特征提取 → 生成RP → 分类/回归。
常见的two stage目标检测算法:R-CNN、Spp-Net、Fast R-CNN、Faster R-CNN和R-FCN等。 -
2、One stage目标检测算法
直接提取特征来预测物体类别和位置。
步骤:特征提取 → 分类/回归。
常见的one stage目标检测算法有:OverFeat、YOLO v1-3、SSD和RetinaNet。
网友评论