文档扫描和识别

作者: 爱拉锋 | 来源:发表于2018-07-15 02:19 被阅读0次

文档扫描和识别
扫描件转换成word文档
手机扫描仪？微信免费将纸质文件转换为电子档，你居然还不知道！
iOS 13的VisionKit
01 勘察：利用 Nmap 扫描并识别服务
Mac图文识别软件你知道哪款好用吗？Readiris Pro 1
发票识别核验接口
Serverless Framework + OCR 快速搭建通
增值税发票扫描识别SDK
增值税发票扫描识别sdk系统

这是「笔记和文档」系列之六

本文结构：

扫描类 App 推荐
- #1 Office Lens
- #2 Scanbot
- #3 扫描全能王（CamScanner）
- #4 FineScanner
- #5 Scanner Pro
Scanner Pro 使用简介
- #1 扫描
- #2 检查
- #3 手动调整
- #4 App 设置
OCR 类 App 推荐
- #1 TextGrabber
- #2 白描
- #3 小嘿扫描
白描使用简介
- #1 页面扫描
- #2 文字识别

有位著名的符号学家说，任何文本都是不自足的，其意义是在跟其他文本交互参照、交互指涉的过程中产生的。在吸收新信息时，很重要的一点是理清它与原有信息的关系，这有助于我们理解和记忆。

我建议用户尽量将所有信息都汇入印象笔记，借助标签系统、内部互链构建信息的网状结构，并养成汇入新信息前查询原有信息的习惯。在汇入新信息前查询笔记内的相关信息，不但使先前的记忆被巩固，还加深了对新信息的印象。

尽管纸质出版物的阅读体验更好，但进行后续的整理和转化并不方便。很多人在纸质书上所做的标记、批注，都只是随书被尘封，并不产生其他作用。

在这一点上，电子书还是方便一些，比如多看阅读就支持将批注直接导出到印象笔记：
将多看阅读里的读书批注导出到印象笔记

为了将阅读纸质书时的摘抄和随记都汇入印象笔记，只能多费些工夫来进行数字化。最好能找到书的电子版，找不到的话，只能用扫描类 App、文字识别（OCR）类 App 来分别对付图像和文字。

扫描类 App 推荐

扫描类 App 主要有以下功能：

提示拍摄的角度、距离和稳定性；
根据色差识别边缘，裁去不需要的部分；
细微变形的纠正；
调节亮度和对比度。

和备忘录一样，印象笔记 App 自带扫描功能，如果扫描文件不做其他处理，只是直接存放在笔记中，那么用自带的足够；如果用到更多功能，就需要下载专门的扫描 App。在 App Store 上 Office Lens、Scanbot、扫描全能王（CamScanner）、FineScanner、Scanner Pro 的表现比较出色。

#1 Office Lens

极简设计，基本无法干预；能将 OCR 识别的结果导出为 Office 文档，尽量还原版面；有 Android 版。

Office Lens

#2 Scanbot

设计精美，功能强大，能自定义工作流；有 Android 版。

Scanbot

#3 扫描全能王（CamScanner）

各方面功能都不错；有 Android 版。

扫描全能王

#4 FineScanner

为扫描书籍优化，自动识别对开页，能将弯曲行拉直；OCR 功能强；有 Android 版。

FineScanner

#5 Scanner Pro

获得「编辑精选」荣誉的扫描 App，由 Readdle 推出，在 PDF Expert 中调用时，可以直接在现有 PDF 中插入页面；支持自定义工作流。

Scanner Pro

Scanner Pro 使用简介

Scanner Pro 主界面

打开 Scanner Pro，界面中间是文件列表，以缩略图的形式显示。上方有三个按钮，

点左边的齿轮图标进入 App 设置界面。
点中间的雷达图标可以选择相册中的照片进行处理。

Scanner Pro 会自动识别照片该保留的区域，雷达上的红色角标表示推荐处理的照片数量；在选择界面中，照片会被加框示意保留区域。
右边的「选择」按钮用于管理扫描文件。

#1 扫描

下方用橙色圆形强调的「+」，用于扫描新的内容。

点击按钮，首先进入拍摄界面。Scanner Pro 的拍摄功能为扫描定制，它会自动寻找扫描区域，建议拍摄角度。它会用透明的蓝框追踪识别的区域。当手机保持稳定，蓝框“合焦”时，它会自动拍摄照片。

用 Scanner Pro 扫描书籍封面

#2 检查

在拍摄完成之后，点右下角的图标进入文件查看界面：

查看扫描文件

在此界面可以左右划动切换页面，逐一检查页面的处理情况。

#3 手动调整

我们看到 App 对书籍封面自动处理的结果不理想，所以点右下角的「编辑」按钮进行手动调整。

手动调整扫描文件

首先用下方按钮进行调整。挽救不了的页面，用左边第一个按钮删除或重拍。

第二个按钮用于调整裁剪区域。扫描类 App 都是根据色差来识别边缘，只要边界明显，通常都能自动正确裁剪。

在裁剪界面，左下角灰色按钮的功能在「寻找边框」和「选择全部」之间切换。通过拖动白框四个角上的蓝色圆点来手动调整保留区域，App 提供了放大镜来辅助微调。

调整保留区域

最右边的按钮用于选择颜色模式：

彩色照片模式是高保真模式，缺点是文件体积大，无法彻底去掉环境光导致的灰影。
彩色文档模式是折中的模式，既保留了颜色，又压缩了文件体积。它能够更强力地去灰影，使颜色更饱和，但容易破坏中间调。
黑白文档模式是最强力的处理模式，比彩色文档模式更进一步去掉了颜色信息，和彩色文档模式一样容易破坏中间调。
灰阶照片模式是在彩色照片模式的基础上去掉颜色，和和彩色照片模式一样无法彻底去掉环境光导致的灰影。

App 总是选择折中的彩色文档模式，然而在上面可以看到，经处理封面出现了大块白斑，颜色严重失真。

根据需要选择了合适的颜色模式之后，如果出现色斑或灰影，可以通过调节亮度、对比度来尝试解决。

App 通常能自动识别页面规格，但也有时也会出错，如果显示比例不对，则需要手动选择规格。

#4 App 设置

合理设定一些参数可以使 Scanner Pro 用起来更方便。

自动命名模板

在增加新的扫描文件时 Scanner Pro 会根据模板自动为文件命名，在这里设定适合自己的模板，可以省去一些手动改名的工夫。
自动命名模板
连接云服务

支持 OneDrive 等同步盘和印象笔记、OneNote 两种笔记服务。
连接云服务
云服务也可以在 App 的分享面板里添加。
分享面板
网络接入

打开「Wi-Fi 接入」的开关之后，在同一局域网的其他设备可以在网络或文件浏览器中输入 IP 地址访问文件。
Wi-Fi 接入
扫描设置

本节设置项主要可以：
- 安装 OCR 引擎，启用/禁用自动识别功能；
- 设定扫描的默认参数；
- 定制工作流程（按顺序执行一系列操作），支持分享、上传及文件管理三类操作。
扫描设置
工作流程也可以在 App 的分享面板里添加。

OCR 类 App 推荐

上述扫描 App 都具备 OCR 文字识别功能，但跟专门的 OCR App 相比，要么是识别率较低，要么是缺乏辅助工具。比如 Scanner Pro 的 OCR 功能只支持识别整个文档，不支持仅识别某个页面或区域，因此极不实用。

App Store 里的 OCR 类 App 有 TextGrabber、白描和小嘿扫描三款值得推荐。

#1 TextGrabber

TextGrabber

老牌的 OCR App，和上面的 FineScanner 一样出自 Abbyy 之手。Abbyy 拥有自家的 OCR 技术，因此 TextGrabber 可以实现离线识别。

如图所示，因为是离线识别，TextGrabber 无需拍照就能实时识别，并且能将识别内容中的网址、邮箱和电话号码转化为链接，点击即可启动相应操作。

TextGrabber 的识别率较高，但是面对中文有些水土不服，错误处理换行，识别为英文标点，乱码，诸如此类的问题时常出现。

TextGrabber 有 Android 版。

#2 白描

白描

白描使用了百度的 OCR 接口，因此只能在线识别。白描识别中文的速度和效果比 TextGrabber 更好，此外作者还提供了校对功能，将原图置于识别结果下方，方便检查错误。

白描也有 Android 版。

#3 小嘿扫描

小嘿扫描

小嘿扫描与白描比较相似，同样是在线识别，同样提供校对功能，不同的是，小嘿扫描为批量识别做了优化，进行多页识别更便捷。

白描使用简介

#1 页面扫描

白描自带扫描处理功能

白描自带简单的扫描处理功能，和 Scanner Pro 一样，白描会自动检查扫描区域，给出拍摄建议，并在符合条件的时候自动拍摄。

白描同样支持自动识别和手功调整裁剪区域，同样支持调整颜色模式，但不支持手动调节亮度、对比度，也不支持纠正失真。

#2 文字识别

白描扫描的页面不能像扫描类 App 那样保存为图片或 PDF，只能进行识别操作。

点击右下角的「文字识别」按钮，稍等片刻，来到文字选择界面。

选择要识别的文字

白描将图片上的文字用绿色边框框出，可通过点击或划动来选择识别区域，选中的区域显示为绿色实框。

选好区域后点右下角「查看文字」按钮获得识别结果，在识别结果界面可以进行复制、导出、翻译、校对等操作。

支持校对，方便了用户清除识别错误，然而在校对界面，原图被放在识别结果下方，让人感觉别扭。一是输入法会挡住图片，不方便拖动；二是伸手操作识别的文字时不可避免挡住了视线。

名片全能王在校对识别结果时，会自动显示原图的相应位置，如果白描和小嘿扫描能实现逐行校对，这个功能的实用性会大幅提高。

题图来自 Unsplash，作者 Eli Francis

文档扫描和识别
这是「笔记和文档」系列之六本文结构：扫描类 App 推荐#1 Office Lens#2 Scanbot#3 ...
扫描件转换成word文档
今天继续讲PDF,主要讲PDF阅读器的选择、文字识别成可编辑的WORD文档、手机上扫描识别（CS扫描全能王）一、...
手机扫描仪？微信免费将纸质文件转换为电子档，你居然还不知道！
你还在用扫描仪识别纸质文档吗？职场办公时候经常需要将纸质文档转换为电子档，但又苦于没有扫描仪，所以只能用用最原始的...
iOS 13的VisionKit
VisionKit是一个关于文档识别的框架，可使用摄像头拍摄文档，然后将文档转化为扫描件。两个类 :VNDocu...
01 勘察：利用 Nmap 扫描并识别服务
利用 Nmap 扫描并识别服务配合使用特定脚本和利用特定漏洞：可以用来识别活动主机扫描 TCP 和 UDP ...
Mac图文识别软件你知道哪款好用吗？Readiris Pro 1
mac图文识别软件哪款好用？Readiris Pro 17 for Mac是一款强大的可扫描的文档的光学识别OCR...
发票识别核验接口
关键词：增值税发票扫描识别发票扫描识别验真发票识别查验发票核验发票ocr识别+核验一、增值税发票扫描识别...
Serverless Framework + OCR 快速搭建通
在日常的工作生活中，文字识别与我们息息相关，比如身份证识别、随手拍扫描、纸质文档电子化等，无不显示着文字识别技术的...
增值税发票扫描识别SDK
关键词：增值税发票扫描识别，增值税专用发票扫描识别，增值税普通发票扫描识别，增值税发票扫描识别SDK、发票ocr识...
增值税发票扫描识别sdk系统
关键词：增值税发票扫描识别，增值税专用发票扫描识别，增值税普通发票扫描识别，增值税发票扫描识别SDK、发票ocr识...