关键词:票据OCR、文字识别、字符识别、OCRSDK开发包、表格OCR、票据识别、表格识别、银行票据识别、发票识别
一、产品简介
固定格式表格自定义识别SDK系统是一款通用的数据批量采集软件,适用于具有表格特征的表单、问卷、单证,通过扫描、图像处理、自动分类、OCR(光学字符识别)技术,将表格图像中的数据信息准确、快速、真实地提取并保存,数据结果可导出为标准的数据格式,如Excel表,与企事业单位的ERP、CRM等系统实现无缝结合。系统支持中英文、数字、符号等多类型字符的手写体、印刷体识别。
二、应用背景
固定格式表格自定义识别SDK是一种高度精炼,集中的信息表达手段,纸质表格被广泛的应用于数据采集,将纸质表格数据转换成电子数据是信息化必然趋势。传统的人工数据录入方式效率低下、差错率高、成本昂贵,北京文通科技结合其在OCR(光学字符识别)领域的尖端技术,为客户提供企业级的数据采集方案,在数据采集和数据应用之间架起高速通道。
传统的人工数据录入方式,这是目前企业使用最多最直接的方式,由专门的数据录入员将数据一条一条录入计算机存储,数据流向企业ERP系统、Excel记录型表格。这种方式耗费了大量的人力和时间,计算机在此方案中只是数据载体,并未高效应用,弊端显而易见:
1、录单任务繁重、强度大、录入员在高强度重复工作状态下极易疲劳出错;
2、增加录单人手、增加计算机设备都导致办公成本增加;
3、基础数据采集效率低下导致综合统计数据滞后,导致公司的其他业务信息管理系统(如ERP、CRM)所发挥的性能大打折扣,从而影响企业正确决策。
使用固定格式表格自定义识别SDK技术实现自动录单,目前部分ERP软件商集成了OCR(光学字符识别)技术,通过批量扫描识别的方式采集表单、订单数据,大大提高数据采集的效率。固定格式表格自定义识别SDK录单方式是对传统录入方式的一个颠覆,基于先进的图像处理、OCR&ICR(智能字符识别)技术,把繁重重复的工作交给计算机去处理,充分发挥了计算机处理技术的优势,录单主体的变更带来的是录单效率本质的提高,这也是OCR技术的初衷。简单举例,一张A4订单中有15条数据,熟练录入员录单需要120秒,而OCR技术仅需要1.5秒,速率提高是120S/1.5S = 79倍,优势极为明显。
三、系统流程概述
3.1 工作流程概述
系统流程图
3.2 固定格式表格自定义识别SDK系统识别性能参数
· 识别字符类型
· 印刷体:中文(简繁体)、英文、数字
· 手写体:中文(简繁体)、英文、数字
· 符号类:标识码、条码、 CheckBox、╳、▇、○、●等,可定制符号
· 8种可定制字符:日、韩、蒙古、藏、维吾尔、哈萨克、柯尔克孜、阿拉伯文
· 识别速度
· 单张表格的识别速度在 1 秒钟左右;
· 识别率
· 对于版面整洁的印刷字符的识别,正确率达99.96%
· 对于规范手写数字、英文的识别,正确率达98.5%
· 对于规范手写汉字的识别,正确率在 85%左右;
3.3 固定格式表格自定义识别SDK主要模块及功能特点
表格模板编辑器:轻松快速定义识别模板;
图像预处理模块:自动去黑边、自动纠偏、去噪声、图像自动旋转、多种二值化方法处理;
表格自动分类:系统能自动区分当前表格、票据的业务类别,实现全自动归档;
字符识别引擎:支持识别丰富的文字、符号类型;
快速校对工具:纵向(集字)校对器、横向校对器。
3.4 固定格式表格自定义识别SDK开发环境
计算机性能:CPU-2.0GHz,内存-512MB,硬盘-2G;
操作系统:Windows系列
API接口:以标准的DLL(动态链接库)、OCX控件方式提供,支持VB、C#、Delphi、PB、C/C++/VC++、Java等常用程序语言的调用;
四、我们的服务
我们的宗旨是为客户提供企业级的数据采集技术,我们的技术服务内容包括识别需求评估、表格规范设计、模板定制、二次开发技术支持,在企事业客户开发应用系统的过程中,我们将全程跟踪,为客户方提供专业团队的技术服务。
五、应用领域
· 制造业:订货会订单处理、生产计划等表单处理
· 政府部门:各种申请表、申报表的数据录入
· 银行、证券部门:存单、储单、证券交易单据、信用卡申请表的数据录入
· 工商、税务部门:各种纳税申报表、组织结构代码申报表的数据录入
· 统计部门:社会调查表、人口普查表、农业普查表、商业调查表的数据录入
· 人事部门:人事测评、干部考核表的数据录入
· 保险行业:保险单的数据录入
· 企、事业单位:进出库票据、订货单、单位内部报表的数据录入
运营:北京文通科技 张强
网友评论