美文网首页
PDF转文本乱码问题

PDF转文本乱码问题

作者: 离言碎语 | 来源:发表于2018-11-29 16:17 被阅读0次

    今天碰到一个特别难搞的PDF文件,不管是转Word、转TXT还是直接复制粘贴都会出现乱码和文字丢失/重复等情况,比如原文是这样的:



    用Adobe Acrobat DC 转成Word后会出现多余的文字:


    文字重复
    转成TXT则文字几乎全部丢失:
    文字丢失

    直接从PDF文档中复制再粘贴则会出现乱码:


    乱码
    最后的解决办法是用OneNote的文字识别功能。在PDF中截图,复制到OneNote中,然后右键“复制图片中的文本”即可得到完整版的文字。反正目前没找到更好的办法,只能一张张截图再识别了。
    准确识别

    相关文章

      网友评论

          本文标题:PDF转文本乱码问题

          本文链接:https://www.haomeiwen.com/subject/mbefcqtx.html