美文网首页cv paper reading
Arbitrary-Oriented Scene Text De

Arbitrary-Oriented Scene Text De

作者: yanghedada | 来源:发表于2019-03-29 11:07 被阅读0次

    这是一篇关于任意角度字符区域检测文章。

    论文的总体预览

    • 简介
      对目标区域的检测不仅仅是[x1,y1,x2,y2],而是(x,y,h,w,θ).其中(x,y)代表中心点坐标,(h,w)是短边和长边,θ是与水平轴的夹角.这篇论文在水平座标的基础上加上了θ任意角度这个信息,提高对text检测的准确性能,从体来说论文是基于faster-rcnn进行改进,通过添加Rotation Region Proposal Networks (RRPN),这个任意角的区域推荐网络,生成任意角度的推荐区域,通过Rotation Region-of-Interest (RRoI),在feature map上进行热议角度的区域裁剪或者池化操作。
    • anchors
      scale,Ratio与faster r-cnn是相同设置,增加angle=(-pi/4, 3pi/4),angle实际使用[2pi/3,...-pi/6].
    image.png
    • 斜的IoU和NMS

    对IoU计算需要考虑角度,NMS计算也需要考虑角度

    image.png
    • 斜的ROIpool
    image.png
    • 真实坐标,预测坐标,anchors之间的变换

    这里新增的对于角度的仿射变换是 θa−θg+kπ,k的目的是为使θ在[-pi/4, 3pi/4]内。

    image.png
    • loss变换
      新增的θ与x,y同等对待。
    image.png

    参考:
    paper
    caffe 源码
    tensorlfow复现
    Rotation-Proposals

    相关文章

      网友评论

        本文标题:Arbitrary-Oriented Scene Text De

        本文链接:https://www.haomeiwen.com/subject/zvwkbqtx.html