美文网首页
非极大值抑制

非极大值抑制

作者: geekvc | 来源:发表于2017-12-02 22:29 被阅读31次

    Nms主要目的

    在物体检测非极大值抑制应用十分广泛,主要目的是为了消除多余的框,找到最佳的物体检测的位置。

    • 等待
    image.png

    如上图中:虽然几个框都检测到了人脸,但是我不需要这么多的框,我需要找到一个最能表达人脸的框。下图汽车检测也是同样的原理。

    [图片上传失败...(image-a0c46b-1512223034395)]

    3领域情况非极大值抑制

    3邻域是指判断该点是否比左边的一个点以及右边的一个点的数值大

    [图片上传失败...(image-79154b-1512223034395)]

    代码简单分析:对于一个从I[0]到I[W-1]的输入序列,对于有左邻和右邻的是从1到W-2,所以循环的初始位置是1。

    (1)代码的3-5行是判断当前点是否左邻和右邻的值大,如果大的话该点就是极大值点。对于这样的点我们就已经知道i+1位置的值比i的小,所以对i+1的位置就不需要处理,所以可以直接处理i+2位置。对应于代码的第12行。

    [图片上传失败...(image-b63d83-1512223034395)]

    (2)如果在第3行代码中,不满足条件,那么该点的右邻就作为候选,对于代码第7行。循环的使用这一条件,候选就会采用单调递增的方式一直向右查找,直到找到满足大于右邻的点(对应于代码8-9行),若该点不是最右的点,则满足条件,为极大值点(对应于代码的10-11行)。

    [图片上传失败...(image-337886-1512223034395)]

    原理

    非极大值抑制,顾名思义就是把非极大值过滤掉(抑制)。下面我就R-CNN或者SPP_net中的matlab源码来进行解释。

    
    function picks = nms_multiclass(boxes, overlap)
    
    %%boxes为一个m*n的矩阵,其中m为boundingbox的个数,n的前4列为每个boundingbox的坐标,格式为
    
    %%(x1,y1,x2,y2);第5:n列为每一类的置信度,一共n-5+1个置信度
    
    %%overlap为设定值,0.3,0.5 .....
    
    x1 = boxes(:,1);%所有boundingbox的x1坐标
    
    y1 = boxes(:,2);%所有boundingbox的y1坐标
    
    x2 = boxes(:,3);%所有boundingbox的x2坐标
    
    y2 = boxes(:,4);%所有boundingbox的y2坐标
    
    area = (x2-x1+1) .* (y2-y1+1); %每个%所有boundingbox的面积
    
    %可能是从零开始,所以要加1
    
    picks = cell(size(boxes, 2)-4, 1);%为每一类预定义一个将要保留的cell
    
    %cell是一种很牛逼的数据类型,每个单元可存储任何数据,矩阵、传递函数、自定义类型
    
    %创建
    
    a=cell(n,m) 
    
    那么就把a初始化为一个n行m列的空cell类型数据,
    
    预分配内存
    
    %读取内容:{下标}和(下标)  区别在于类型()是cell数组 ,{}是实际类型.结果显示是一致的,下标从1开始
    
    a=cell(2,2);%预分配
    
    a{1,1}='cellclass';
    
    a{1,2}=[1 2 2];
    
    a{2,1}=['a','b','c'];
    
    a{2,2}=[9 5 6];
    
    %以上创建一个
    
    %
    
    size(X,1),返回矩阵X的行数;
    
    %size(X,2),返回矩阵X的列数;
    
    (1)s=size(A),
    
    当只有一个输出参数时,返回一个行向量,该行向量的第一个元素时矩阵的行数,第二个元素是矩阵的列数。
    
    (2)[r,c]=size(A),
    
    当有两个输出参数时,size函数将矩阵的行数返回到第一个输出变量r,将矩阵的列数返回到第二个输出变量c。
    
    (3)size(A,n)如果在size函数的输入参数中再添加一项n,并用1或2为n赋值,则 size将返回矩阵的行数或列数。其中r=size(A,1)该语句返回的时矩阵A的行数, c=size(A,2) 该语句返回的时矩阵A的列数。
    
    for iS = 5:size(boxes, 2)%每一类单独进行
    
        s = boxes(:,iS);
    
        [~, I] = sort(s);%置信度从低到高排序,只要s的索引,赋值给I,~表示占位 表示函数输出的某个值在接下来并不使用
    
    %[B,ind]=sort(A),计算后,B是A排序后的向量,A保持不变,ind是B中每一项对应于A 中项的索引。排序是安升序进行的
    
        pick = s*0;
    
        counter = 1;
    
        while ~isempty(I)
    
          last = length(I);
    
          i = I(last); 
    
          pick(counter) = i;%无条件保留每类得分最高的boundingbox
    
          counter = counter + 1;
    
          xx1 = max(x1(i), x1(I(1:last-1)));
    
          yy1 = max(y1(i), y1(I(1:last-1)));
    
          xx2 = min(x2(i), x2(I(1:last-1)));
    
          yy2 = min(y2(i), y2(I(1:last-1)));
    
          w = max(0.0, xx2-xx1+1);
    
          h = max(0.0, yy2-yy1+1);
    
          inter = w.*h;
    
          o = inter ./ (area(i) + area(I(1:last-1)) - inter);%计算得分最高的那个boundingbox和其余的boundingbox的交集面积
    
          I = I(o<=overlap);%保留交集小于一定阈值的boundingbox
    
        end
    
        pick = pick(1:(counter-1));
    
        picks{iS-4} = pick;%保留每一类的boundingbox
    
    end
    
    

    相关文章

      网友评论

          本文标题:非极大值抑制

          本文链接:https://www.haomeiwen.com/subject/issobxtx.html