自定义ocr 模板
中篇介绍自定义模板。
由于需要的数据在界面上显示的位置比较固定,因此可以通过OCR 识别来获取文本内容。又由于需要提取指定的字段内容,我们选择自定义模板来实现功能。
何为自定义模板?
支持用户通过简单的标注创建专属自己的模板,生成识别规则。模板创建后,用户可通过API接口批量识别同类图片内容信息,获得定义好的输出结果,满足用户的个性化OCR需求
百度云,阿里云都有自定义模板功能,两种方式我都使用过,操作模式相同 。对下来 百度云的准确性相对高些,套餐价格比较便宜,单次不到两分钱 阿里云识别率比百度云低点,阿里云的优势是有500次的免费额度可以使用,个人使用应该足够了。
设置定义模板
以阿里云为例,演示下如何进行自定义模板设置 https://ocr.data.aliyun.com/
目前只能使用主账号设置,还不支持子账号设置
选择定位点,定位点不少于四个
image image image选择识别内容
image保存
试一试,没问题,就可以发布了
image发布生成模板id
注意样图要清晰完整
购买接口次数
自定义模板设置好后就可以购买接口调用次数 总的来说 阿里云 需要付费的接口调用次数比较贵,还在有500次免费额度。
阿里云套餐
image百度云套餐
image调用接口
以阿里云python 为例:
import urllib, urllib2, sys
阿里返回的数据是json 格式,下篇 将介绍把如何将json 转换到excel 中,敬请期待!
网友评论