用Python&Tesseract识别图片文字

用Python&Tesseract识别图片文字

作者: 我爱学python | 来源:发表于2019-04-14 16:18 被阅读15次

用Python&Tesseract识别图片文字
Tesseract OCR（光学字符识别）
Tesseract OCR图片识别为文字
知网注册（传统图片验证码识别）
Tesseract Ocr文字识别
使用Tesseract实现图片文字识别
Python图像处理之图片文字识别（OCR）
利用Python来实现图像识别已经图像处理功能！完虐80%的图片
用Python进行图文识别（OCR）
用Python进行图文识别（OCR）！

在一个项目中遇到这样的需求，要把一堆图片中的文字识别出来并分门别类地保存数据库，上万字纯手工敲是下下策，网上有很多图片转文字的在线服务，单张图转没什么问题，可惜大批量的图缺乏定制化，爱捣鼓的程序员还是自己动手靠谱，开源项目 Tesseract 专用于 OCR 识别，它的应用场景非常多，比如验证码识别、车牌识别、普通的文字图片识别都不是问题。

安装

Linux 和 Mac 平台的安装非常简单，直接命令行安装即可，默认只有英文语言包，汉语包需要额外指定

sudo apt-get install tesseract-ocr # ubuntu

brew install tesseract # macOS

Windows 平台需要二进制安装包，官方下载地址https://github.com/tesseract-ocr/tesseract/wiki/4.0-with-LSTM#400-alpha-for-windows，安装时需要选择中文语言包才是识别汉字

配置

安装完成后，需要设置两个环境变量$PATH和$TESSDATA_PREFIX，如果不指定后面会报错，把 tessertact 的安装路径加入 PATH 变量中，TESSDATA_PREFIX 变量的值指定为语言包的路径

实战

Python-tesseract 是 tessertact 的 Python 封装包，它需要依赖图片处理库 PIL（Pillow），环境搭建完成后就可以开始做定制化开发了。

以下我以杜甫的《登高》作为 demo 从中提取出其中的文字

输出结果：

风急天高猿哨哀 , 渚清沙白鸟飞回。

无边落木萧萧下 , 不尽长江滚滚来。

万里悲秋常作客 , 百年多病独登台。

艰难苦恨繁霜鬓 , 漫倒新停浊酒杯。

你可以根据自己的业务需求进行自定义开发，为了适应不同的环境下的图片，你可能需要了解更多 Tesseract 的API，以此来提高文字识别的准确率。如果你有兴趣，甚至基于公众号开发，用户上传图片，自动识别出文字，提供收费服务也不是没有可能。

相关文章

用Python&Tesseract识别图片文字
在一个项目中遇到这样的需求，要把一堆图片中的文字识别出来并分门别类地保存数据库，上万字纯手工敲是下下策，网上有很多...
Tesseract OCR（光学字符识别）
Tesseract OCR（光学字符识别）教程iOS图像文字识别IOS 文字图片识别 Tesseract OCR（...
Tesseract OCR图片识别为文字
1 场景识别图片中的文字（识别图片中的电话号码、姓名等） 2 方案使用Tesseract OCR软件来识别图片...
知网注册（传统图片验证码识别）
知网注册（传统图片验证码识别）灰度化二值化tesseract提取图片文字代码如下：
Tesseract Ocr文字识别
Tesseract Ocr文字识别环境 windows10 + python 3.6 + tesseract 4...
使用Tesseract实现图片文字识别
在Ubuntu Linux下通过go语言实现图片中文识别 1、安装tesseract ocr包如果是在Cento...
Python图像处理之图片文字识别（OCR）
OCR与Tesseract介绍将图片翻译成文字一般被称为光学文字识别（Optical Character R...
利用Python来实现图像识别已经图像处理功能！完虐80%的图片
OCR与Tesseract介绍将图片翻译成文字一般被称为光学文字识别（Optical Character Rec...
用Python进行图文识别（OCR）
OCR与Tesseract介绍将图片翻译成文字一般被称为光学文字识别（Optical Character Rec...
用Python进行图文识别（OCR）！
OCR与Tesseract介绍将图片翻译成文字一般被称为光学文字识别（Optical Character Rec...

网友评论

本文标题：用Python&Tesseract识别图片文字

本文链接：https://www.haomeiwen.com/subject/allswqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

Python小哥哥

Python学习资料整理

热点阅读

Python小哥哥

Python学习资料整理

关于我们|服务条款|联系我们|用Python&Tesseract识别图片文字|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！