传统的目标检测(Object Detection)算法,把分类和位置检测分开,例如:
- Deformable Parts Models (DPM,可变形的组件模型) ,由大神Felzenszwalb在2008年提出,是一种基于部件的检测方法,对目标的形变具有很强的鲁棒性。DPM算法采用了改进后的HOG特征,SVM分类器和滑动窗口(Sliding Windows)检测思想曾经是PASCAL challenge的SOTA技术, Felzenszwalb本人也因此被PASCAL VOC授予"终身成就奖"。DPM算法的滑动窗口大约每张图片有250,000个,由此导致了DPM算法的检测速度非常慢,2015年,基于深度学习的目标检测算法火了之后,DPM的光芒似乎渐渐消失了。
DPM每张图片大约有250,000个滑动窗口 - Faster RCNN,是大神Ross Girshick在2015年提出的一种基于深度学习的目标检测算法,核心组件有用于生成候选框的Region Proposal Network和用于检测候选框中物体是什么的Object Detection Network。
Faster RCNN的构架
Faster RCNN是two-stages中优秀检测器代表,但这种先在图像中生成潜在的候选框,然后在这些候选框上运行分类器,最后运行后处理用于细化边界框,消除重复检测导致检测速度不够快,无法满足实时检测的要求。 各种目标检测器性能比较表 - YOLO算法,是Joseph Redmon大神于2015年发表的one-stage目标检测算法,其显著特点是Unified Detection,即将分类和位置回归都统一到一个CNN网络,由此极大减少了计算量,实现了能满足实时检测要求的检测速度。 1649214767(1).png
YOLO构架最大的贡献是证明了深度学习网络就是输入矩阵到输出矩阵的变换,只要设计好了输出矩阵和损失函数,一切都可以由一个深度学习网络搞定!
YOLOv1就是典型的由图像像素矩阵,通过深度学习网络一次性转换为边界框坐标和类概率矩阵的范例,非常直观,非常容易理解! YOLO Model接下来,从零开始基于PyTorch实现YOLOv1算法,从知道进阶到做到!
网友评论