之前也大概看了一些论文和博客,也做过目标检测的PPT,给人讲过几次,但是一直没有一个比较完整详细的记录下来,故想好好的整理下。
-
什么是目标检测
CV领域有四大任务:- 分类:判断图片包含说明类型的目标
- 定位: 给出目标的位置
- 检测:给出目标的位置及类别
- 分割: 判断每一个像素属于哪个目标物或场景
-
核心问题
- 目标可能出现在图片的任何位置
- 目标的形状多样
- 目标大小多样
3 评价指标
评价的指标有多个维度,一般常用的map,fps等,这里我们介绍下一些指标。
-
TP, FP,TN, FN ,Recall,Precision
TP.PNG
召回率是对全局的一个把握,即系统检测到的数目除以系统所有的需要检测的数目,准确率是对你给出检测的精度一个定义,是检测正确的数目除以总检测数。
-
P-R曲线
PR.PNG
以召回率为横坐标,精确率为纵坐标,用不同的阈值,统计不同阈值下的召回率和精确率。
AP(average precision) - PR曲线下的面积
mAP多个类别的平均AP值 -
IOU
IOU.PNG
IOU-intersection of union ,交并比,定义如下:
-
FPS
fps:frame per second ,每秒处理图像的帧数
-
目标检测的历史
从two-stage到one-stage,从r-cnn到faster r-cnn甚至更多版本的two-stage,one-stage的方法也从yolov1到yolov3,ssd以及衍生的多种ssd的方法,目标检测基本上都是沿着这两条路线,故我们看下其发展,从而开始有序的看论文。
之前做过Yolov3的,也看过faster r-cnn的,跑过,但是没有怎么调试,故想接下来认真总结下这些经典的方法。
网友评论