1,在文字检测方向
考虑到不同尺度的图像中文字呈现的差异性如何解决
传统机器学习方法在文字速度和精度的平衡问题
深度学习算法在硬件成本控制中呈现的局限性问题
文本背景呈现的复杂性,文本的失真考虑
2,自然场景下文本存在的一些特征:
颜色,亮度:通过颜色聚类或者图像分割,但是这类信息受到外界环境的影响较大,不稳定;
边缘强弱:文本和背景存在区域对比度高,提取垂直和水平边缘
尺寸大小:图像分块考虑?根据对象特征选取合适的划分,提取到新的方法对边缘进行二值化(收获通过自己改进的方法,效果不错),得到感兴趣的字符
空间位置关系(需考虑到倾斜畸变等因素)
网友评论