美文网首页
ABBYY软件的PDF识别模式有什么作用

ABBYY软件的PDF识别模式有什么作用

作者: 克丁克丁 | 来源:发表于2021-05-11 13:45 被阅读0次

在使用ABBYY FineReader PDF 15进行OCR文字识别之前,要想快速获得准确的识别效果,需要根据要识别的文件类型以及复杂度,在“设置”里对OCR选项进行设置。

点击菜单栏右侧的“齿轮”按钮,或者快捷键“Ctrl + >”打开“设置”界面,并在“设置”界面选择“OCR”选项。

图1:OCR选项界面

PDF识别模式

所谓PDF识别模式实际是在使用OCR识别PDF文件的时候,针对PDF文件里的内容类型采用的模式。

PDF文件的内容有两种类型:一种是图形,图形里的文字是不可被选择的;一种是文字可被选择和编辑的,大多从Word等可编辑的文件转换过来的。

图2:PDF中的两种类型的内容

针对上述两种类型的内容,ABBYY FineReader PDF 15软件提供了三种识别模式:

使用OCR

主要针对不可编辑的图片而言。它在OCR识别时创建一个新图层,放置从图片上识别出来的文字,使该文字可以被编辑。在PDF编辑器界面中,选择“文件”-“识别文档”-“识别文档”,对图片进行OCR识别模式后,就可以对图片上的文字进行编辑了。

图3:对图片进行OCR识别

使用PDF中的文字

它针对的是那些本身自带有文本图层,其文字可以被选择的PDF文件,软件在此模式下不执行OCR。

自动在OCR和PDF中的文字之间选择

这是两种识别模式的结合。ABBYY软件先检查PDF文件是否有文本图层,若有,则使用现有的文本图层。否则,则创建新图层放置提取的文字。对大多数用户来说,可以选择这个选项作为默认选项。

在PDF编辑器中启用背景识别

“在PDF编辑器中启用背景识别”是“设置”界面中“图像处理”选项里的一个选项。如果选择了该选项,使用ABBYY FineReader PDF 15软件在打开一个PDF文件时,会根据选择的PDF识别模式,建立文本图层(使用原有的文本图层或者创建新的文本图层),使文字与背景分离。当使用“PDF工具”的“编辑工具”时,可以对文字进行编辑。而无需在“文件”-“识别文档”中选择“识别文档”,实现打开PDF文件即可对文本进行编辑。

图5:实现打开PDF文件自动识别文字

总结

ABBYY FineReader PDF 15 OCR文字识别软件通过PDF识别模式和背景识别的结合,使对PDF文件的编辑变得简单方便,这就是为什么越来越多的使用者把ABBYY FineReader PDF 15软件作为默认的PDF编辑器的原因。

相关文章

网友评论

      本文标题:ABBYY软件的PDF识别模式有什么作用

      本文链接:https://www.haomeiwen.com/subject/tpwgdltx.html