1、文字定位
1、标注数据
1、标注数据的软件生成对应的xml、json等格式的文件,里面存储的是图片上目标对应的一系列坐标。
2、在标注的时候注意需要标注所有的文字,用label显示那些是需要的那些是要忽略的。
2、定位文字(数据标注和定位算法的选择对定位结果的影响还是比较大的)
2、文字识别
1、首先用在公用数据集上训练的文字识别模型进行文字识别
2、如果效果不好考虑在common_model的基础上,用自己的数据集进行微调
1、手动截取定位到的文字,手动输入图片上的文字(慢、无法大量)
2、用程序生成相关背景、字体、颜色的大量图片和相对应的图片上的文字
3、测试微调后的结果,这个微调应该是针对数据集的
网友评论