美文网首页mac软件摄影
PDF Converter OCRmac如何提高OCR转换质量

PDF Converter OCRmac如何提高OCR转换质量

作者: ddc37b82a0e4 | 来源:发表于2019-04-28 13:51 被阅读2次

    PDF Converter OCR for Mac是一款运行在Mac平台上的PDF转换工具,PDF Converter OCR Mac版支持将PDF文件转换成多种格式的文件,PDF Converter OCRmac激活版还具有OCR功能,可将扫描的PDF文档转换为可编辑格式。

    OCR(光学字符识别)并非易事,源PDF和OCR选项的质量都会影响输出文件的质量和准确性。一项基于对19世纪和20世纪初报纸页面的认可的研究得出结论,商业OCR软件的逐字符OCR准确度从71%到98%不等。

    本教程将向您展示如何使用PDF到Word OCR提高OCR转换质量

    1.选择正确的文档语言。

    您需要在OCR转换之前选择适当的文档语言。这是获得准确的文本识别结果非常重要的一步。

    例如,如果您的PDF是法语,但您选择英语作为OCR语言,则无法正确识别非英语字符,如'éà'。

    该应用程序支持10种语言,包括英语,法语,德语,意大利语,西班牙语,葡萄牙语,波兰语,瑞典语,俄语和荷兰语。

    2.提高扫描分辨率

    转换质量取决于原始PDF的质量。文档图像质量差和文档偏斜可能无法准确转换。

    PDF文档中的图像应至少为300 dpi,对于字体较小的文档,建议使用600 dpi。或者文本将粘在一起,OCR很难识别这些文本。

    3.将页面旋转到正确的方向

    文档的方向不正确会导致转换质量不佳。

    将鼠标光标移动到内置PDF阅读器的左上角,您将看到旋转按钮出现。旋转操作仅影响当前页面。

    4.选择图像区域。

    提取文本是执行OCR的主要目的,如果扫描的PDF包含图像元素,则需要在转换之前选择它们以获得更好的格式保存和准确性。

    (1)要选择图像区域,请将鼠标光标移动到内置阅读器,按住鼠标左键并拖动以选择区域。然后释放鼠标。

    (2)要移动或调整区域,请单击该区域并将区域边框拖动到所需位置。

    (3)要删除所选区域,只需选择并按键盘上的“删除”按钮,或将鼠标光标移动到内置PDF阅读器的左上角,即可看到“删除”按钮。您可以删除本文档中的单个选定区域或所有选定区域。

    选定区域将作为转换后的Word文档中的图像保留,并且应用程序不会对选定区域执行OCR。通过这样做,您可以更好地保持原始布局。如果不选择图像区域,图像上的文本也将被OCR,但输出文档中的图像将丢失。

    相关文章

      网友评论

        本文标题:PDF Converter OCRmac如何提高OCR转换质量

        本文链接:https://www.haomeiwen.com/subject/htudnqtx.html