应用示例：图像文字识别

应用示例：图像文字识别

作者: SmallRookie | 来源:发表于2017-12-02 10:20 被阅读145次

应用示例：图像文字识别
哲哲的ML笔记（三十六：应用实例：图片文字识别）
Tesseract OCR（光学字符识别）
移动端车牌识别SDK开发包（包括安卓和IOS）
Core Image编程指南翻译二（图像处理）
可随时测试的移动端车牌识别
iOS图像文字识别
NLP
发票OCR识别如何做到不出错
激活函数、正向传播、反向传播及softmax分类器，一篇就够了！

Problem Description and Pipeline

在图像文字识别应用中，我们希望从给定的图片中识别图中的文字，如：

为了实现图像文字识别，常采取如下步骤：

文字检测（text detection）
字符切割（character segmentation）
字符分类（character classification）

滑动窗口（Sliding Windows）

滑动窗口是一项用来从图像中抽取对象的技术。

滑动窗口技术也被用于文字识别，首先训练模型能够区分字符与非字符，然后运用滑动窗口技术识别字符，一旦完成了字符的识别，我们将识别出的区域进行扩展，然后将重叠区域合并。

第一步为文本检测：

下一步为字符切割：

最后一步为字符分类，利用神经网络、支持向量机或逻辑回归训练分类器即可。

Getting Lots of Data and Artificial Data

如果我们的模型出现欠拟合问题，那么利用更多的数据训练模型是能得到更好的效果。然而，我们如何获取数据呢？

以文字识别为例，我们可以从字体网站上下载各种字体，然后利用这些不同的字体配上各种不同的随机背景图片，人为地构建训练数据。

另一种方法为，利用已有的数据对其进行修改，如：扭曲、旋转和模糊处理等。

获得更多数据的几种常用方法为：

人工数据合成
手动收集、标记数据
众包

Ceiling Analysis：What Part of the Pipeline to Work on Next

在机器学习的应用中，我们通常需要通过几个步骤才能进行最终的预测，那么我们如何能够知道那一部分最值得我们花时间和精力去优化呢？因此，我们引入上线分析法。

我们仍以文字识别为例，其流程图如下：

现假设文字识别的正确率为72%，如果我们令文本检测（Text detection）部分的正确率为100%，则发现整个模型的正确率提升至89%；如果我们令字符切割（Character segmentation）部分的正确率为100%，则发现整个模型的正确率提升至73%；如果我们令字符识别（Character recognition）部分的正确率为100%，则发现整个模型的正确率提升至82%。

从中我们可以得出结论，优化文本检测和字符识别对整个模型的正确率提升较大，这两部分是值得我们花费时间和精力优化的。

一些测试题：

Coursera版Andrew NG的机器学习课程到此结束，课程编程练习源码及相关资料，可访问本人的Github。最后，感谢Ryan Cheung以及其它乐于分享的网友！

相关文章

应用示例：图像文字识别
Problem Description and Pipeline 在图像文字识别应用中，我们希望从给定的图片中识别...
哲哲的ML笔记（三十六：应用实例：图片文字识别）
OCR 图像文字识别应用所作的事是，从一张给定的图片中识别文字。这比从一份扫描文档中识别文字要复杂的多。为了完成...
Tesseract OCR（光学字符识别）
Tesseract OCR（光学字符识别）教程iOS图像文字识别IOS 文字图片识别 Tesseract OCR（...
移动端车牌识别SDK开发包（包括安卓和IOS）
知识普及：OCR技术又称图像识别，通俗来讲就是通过拍照、扫描把实物转化为图像信息，再利用文字识别技术将图像文字信息...
Core Image编程指南翻译二（图像处理）
示例代码下载图像处理图像处理意味着应用滤镜 - 图像滤镜是一个软件，它逐个像素地检查输入图像，并在算法上应用一...
可随时测试的移动端车牌识别
目前，OCR识别技术应用广泛，主要应用有车牌识别、证件识别、文字识别、人脸识别等。首先拿车牌识别的应用来说：目...
iOS图像文字识别
首先在github下载demo源码图像识别 Tesseract OCR,打开demo运行是可以的，但是自己放一张含...
NLP
本地搜索文本匹配，与文本转化为声音匹配。与语音识别翻译 ML:搜索识别，语音识别，文字识别，图像...
发票OCR识别如何做到不出错
发票OCR识别 OCR=光学字符识别，是一种从图像当中智能提取文字的技术。发票OCR识别，特指从发票图像中，把对...
激活函数、正向传播、反向传播及softmax分类器，一篇就够了！
1. 深度学习有哪些应用图像：图像识别、物体识别、图片美化、图片修复、目标检测。自然语言处理：机器创作、个性化...

网友评论

Artificial Intelligence

本文标题：应用示例：图像文字识别

本文链接：https://www.haomeiwen.com/subject/kbdgvxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

Artificial Intelligence

热点阅读

Artificial Intelligence

关于我们|服务条款|联系我们|应用示例：图像文字识别|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！