美文网首页
目标检测入门

目标检测入门

作者: Elijah_cs | 来源:发表于2019-07-18 14:00 被阅读0次

    之前也大概看了一些论文和博客,也做过目标检测的PPT,给人讲过几次,但是一直没有一个比较完整详细的记录下来,故想好好的整理下。

    1. 什么是目标检测
      CV领域有四大任务:

      • 分类:判断图片包含说明类型的目标
      • 定位: 给出目标的位置
      • 检测:给出目标的位置及类别
      • 分割: 判断每一个像素属于哪个目标物或场景
    2. 核心问题

      • 目标可能出现在图片的任何位置
      • 目标的形状多样
      • 目标大小多样

    3 评价指标
    评价的指标有多个维度,一般常用的map,fps等,这里我们介绍下一些指标。

    • TP, FP,TN, FN ,Recall,Precision


      TP.PNG

    P(准确率) = \frac{TP}{TP+FP}   R(召回率) = \frac{TP}{TP+FN}

    召回率是对全局的一个把握,即系统检测到的数目除以系统所有的需要检测的数目,准确率是对你给出检测的精度一个定义,是检测正确的数目除以总检测数。

    • P-R曲线
      以召回率为横坐标,精确率为纵坐标,用不同的阈值,统计不同阈值下的召回率和精确率。

      PR.PNG
      AP = \int_0^1 {P(R)} \,{\rm d}(R)
      AP(average precision) - PR曲线下的面积
      mAP = \frac{1} {classes} \sum_{i=1}^{classes}\int_0^1 {P(R)} \,{\rm d}(R)
      mAP多个类别的平均AP值
    • IOU
      IOU-intersection of union ,交并比,定义如下:
      IOU = \frac { Area-of-Overlap } {Area-of-Union}

      IOU.PNG
    • FPS
      fps:frame per second ,每秒处理图像的帧数

    1. 目标检测的历史
      从two-stage到one-stage,从r-cnn到faster r-cnn甚至更多版本的two-stage,one-stage的方法也从yolov1到yolov3,ssd以及衍生的多种ssd的方法,目标检测基本上都是沿着这两条路线,故我们看下其发展,从而开始有序的看论文。


    之前做过Yolov3的,也看过faster r-cnn的,跑过,但是没有怎么调试,故想接下来认真总结下这些经典的方法。

    参考:
    目标检测(一)——目标检测综述
    目标检测(二)——评价指标

    相关文章

      网友评论

          本文标题:目标检测入门

          本文链接:https://www.haomeiwen.com/subject/jzgclctx.html