整体结构包括RPN提取,多尺寸roipooling,然后预测三部分:目标分数,外接矩形框,一般四边形。
基于faster rcnn
- 微调anchor
将anchor的尺寸调小,增加一个更小的anchor,让其更适用于检测小目标。 - 使用不同尺寸的pooling
在7x7的基础上增加了3x11(更精细提取竖直方向特征)和11x3(更精细提取水平方向特征)。 - 同时回归水平矩形框和倾斜矩形框
尽管最终目的是得到倾斜矩形框,但是同时预测水平矩形框有助于更准确的预测倾斜矩形框。 -
使用倾斜NMS对于检测临近目标更有效,不会漏检测。
图片.png - 损失函数
倾斜矩形框预测左上角,右上角的四个坐标,以及高度h。偏移量的定义方式和fasterrcnn一样。
网友评论