通过角点定位和场景分割的多朝向场景文本检测

通过角点定位和场景分割的多朝向场景文本检测

作者: FelixFang | 来源:发表于2018-04-29 08:40 被阅读98次

通过角点定位和场景分割的多朝向场景文本检测
DB：Real-time Scene Text Detectio
[AAAI2020]论文翻译DB:Real-time Scene
python通过EAST文本检测器使用OpenCV检测图像中的文
PixelLink：通过实例分割进行场景文本检测
Reading Text in the Wild with Co
EAST 相关网址
[CVPR2020]论文翻译:ABCNet: Real-time
城市驾驶场景下的数据集
40、Excel 将字符按指定长度分割 ETStrSeparat

通过角点定位和场景分割的多朝向场景文本检测

论文主要思想

通过定位文本边框的角点和相对位置的文本区域分割

网络

网络架构

Net.png

特征提取

使用全卷积网络来提取特征、角点检测、位置敏感分割
模型的主干是预训练的VGG16
引入了FPN/DSSD的主干来提取特征

特征提取细节

将VGG16的fc6和fc7分别转换为卷积层conv6和conv7
额外的卷积层(conv8 conv9 conv10 conv11)叠于conv7上方来增大特征提取的感受野
一些DSSD提取的反卷积模块被用天top-down路径中
为了更好的检测不同大小的文本,使用从conv11到conv3 256通道的反卷积模块(conv10 9 8 7 4 conv3的特征被重复使用)
一共内置6个反卷积模块
通过conv11和反卷积模块有更丰富的特征表示,被用来检测角点和预测poistion-sensitive maps

角点检测

类似SSD和DSSD,用默认框检测角点
每一个默认框输出分类得分和偏移,对应于4种类型的角点
采用以一种卷积的方式用两个分支来预测得分和偏移
卷积fiters都设置为256
每个cell有k个default boxes
"score"分支和"offset"分支分别为每一个默认框的每种类型角点输出2个分数和4个偏移(2是指在这个位置是否存在一个角点)

Position-Sensitive 分割

对于文本边框R,一个g*g的网格被用来将边框分成不同的bins
对于每个bin,一个segmentation map被用来决定map中的这个像素是不是属于这个bin
重新使用了F3 F4 F7 F8 F9的特征,他们上面建一些卷积模块,遵循角本检测分支的残余模块
这些块被resize为F3大小,然后用1 2 4 8 16的scale factor.同一尺寸的的输出被加在一起产生更丰富的特征
最后position-sensitive分割图有g*g通道,大小跟输入图一样大,g默认为2

损失函数

lconf.png

lloc.png

llseq.png

Loss.png

相关文章

通过角点定位和场景分割的多朝向场景文本检测
通过角点定位和场景分割的多朝向场景文本检测论文主要思想通过定位文本边框的角点和相对位置的文本区域分割网络网...
DB：Real-time Scene Text Detectio
DBNet 简介由于分割网络的结果可以准确描述诸如扭曲文本的场景，因而基于分割的自然场景文本检测方法变得流行起来...
[AAAI2020]论文翻译DB:Real-time Scene
Abstract 近年来，基于分割的方法在场景文本检测中非常流行，因为分割结果可以更准确地描述各种形状的场景文本，...
python通过EAST文本检测器使用OpenCV检测图像中的文
1 场景在python环境下，使用EAST文本检测器使用OpenCV检测自然场景图像中的文本。即通过算法，检测...
PixelLink：通过实例分割进行场景文本检测
原文：PixelLink: Detecting Scene Text via Instance Segmentat...
Reading Text in the Wild with Co
引言：自然场景图像文本的定位与识别和基于文本的图像检索，该系统基于两个机制，检测方面是region propos...
EAST 相关网址
MSER — 自然场景文本检测文本检测之EASTEAST: An Efficient and Accurate S...
[CVPR2020]论文翻译:ABCNet: Real-time
Abstract 场景文本的检测和识别已受到越来越多的研究关注。现有方法可以大致分为两类：基于字符的和基于分割的。...
城市驾驶场景下的数据集
城市驾驶场景下的数据集目标检测与追踪，语义分割和场景解析是城市驾驶场景里的自动驾驶中对机器学习最主要的几大挑战。...
40、Excel 将字符按指定长度分割 ETStrSeparat
函数名：ETStrSeparate 函数功能：将文本按指定的长度进行分割应用场景： 1、将长文本等长分割为...

网友评论

深度学习之目标检测

本文标题：通过角点定位和场景分割的多朝向场景文本检测

本文链接：https://www.haomeiwen.com/subject/pflolftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

深度学习之目标检测

热点阅读

深度学习之目标检测

关于我们|服务条款|联系我们|通过角点定位和场景分割的多朝向场景文本检测|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！