ABBYY FineReader PDF 15是一款基于AI智能技术的OCR文字识别软件,不仅能进行PDF文档的编辑与管理,而且还能识别图像型PDF文件、图像文件中的文字信息,同时还凭借其高准确度的识别率而深受使用者的喜爱。
虽然ABBYY FineReader PDF 15拥有专业的文本识别技术,但其文本识别率也会受到识别文件的质量以及软件的设置的影响。在本文中,我们会介绍四种提升文本识别率的技巧,供大家参考使用。
图1:识别OCR项目一、提高图像拍摄质量
首先,对于文本识别率影响较大的因素就是文件的质量。一般情况下,扫描的文件能保持较高的质量,而拍摄的文件会由于拍摄角度、亮度、像素等问题,影响到图像的质量。
因此,如果是采用拍摄方式获取文件图像的话,建议使用垂直的拍摄方式,即相机与文件保持垂直,尽量减少歪斜、梯形失真等状况。
图2:垂直拍摄二、修正图像拍摄缺陷
如果图像文件本身已存在拍摄缺陷的话,就需要通过软件设置的方法,修正拍摄缺陷。
如图3所示,ABBYY FineReader PDF 15提供了功能丰富的图像编辑器功能,供进行专业的图像缺陷校正。比如,可以使用“建议的预处理”功能,自动处理一些图像缺陷;或运用校正梯形失真功能,修正由于非垂直拍摄造成的歪斜失真。
图3:图像编辑器三、编辑区域属性
在进行书本的拍摄时,靠近书脊的部分可能会出现一些弯曲,这些弯曲可能会导致ABBYY FineReader PDF 15出现区域识别错误的问题。
比如,软件可能会将文字区域错误识别为图片区域,在这种情况下,如图4所示,就可以重新手动更正区域的属性,将图片区域更正为文字区域,提高文字的识别率。
图4:编辑区域属性四、创建用户语言
当文件中出现了非指定的OCR语言时,ABBYY FineReader PDF 15的识别结果中就可能会出现一些乱码。此时,我们就需要为软件指定OCR语言,使其顺利识别其他的OCR语言。
比如,如果文档中出现一些繁体字时,就需要打开语言选项(工具菜单-选项-语言),选择手动指定OCR语言,并添加“繁体中文”,使得软件正确地识别繁体文字。
图5:语言设置面板五、小结
综上所述,ABBYY FineReader PDF 15拥有专业的OCR文本识别功能,我们可以通过使用精度高、拍摄规范的图像文件,并结合正确的OCR语言设置,获得高准确度的文本识别结果。
网友评论