OCR从入门到不精通

作者: 吴钧泽 | 来源:发表于2016-12-04 02:08 被阅读2259次

OCR从入门到不精通
同源建模、分子对接和分子模拟方法教程往期回顾
“从入门到精通”——西暮
《疯狂Java：突破程序员基本功的16课(修订版)》Java著名
《Android开发从入门到精通》作者: 扶松柏
Vim 从入门到精通
《SQL Server从入门到精通》PDF高清完整版-免费下载
《SQL Server从入门到精通》PDF高清完整版-免费下载
10本Android开发类图书资料，供Android开发者参考学
Blue教程汇总

最近在爬某网站，老是蹦出来验证码，就想着找个OCR破了这个验证码，然后就开始了OCR探索之旅。

首先简单说一下什么是OCR

OCR是（Optical Character Recognition，光学字符识别）的简称，主要用途：

办公用途，用来识别图片里面的文字，可以高效率的录入图片类型文件。
识别网站验证码
详见维基百科或者百度百科

OCR识别的验证码原理

采集一批验证码，根据图片特点进行初步处理（二值化/灰度化/滤波/降噪等处理）
然后分割图片，旋转图片，模板选取，训练算法，让它更准确。
有兴趣的可以看一个Python实现的OCR识别验证码详细demo,实际操作过程挺有意思的，大家有兴趣了可以试试

OCR识别验证码的具体操作

首先我测试了一个百度开源的Node.js实现的OCR包
gitHub地址 https://github.com/netpi/baidu-ocr-api
安装也很简单直接按照官方的文档安装即可
发现百度的这个OCR包识别效果不太理想

node_ocr.png
然后经过一番Google和小伙伴们的推荐选择一个Google开源的tesseract这个是C++写的，直接融合到爬虫里不太方便，有外国朋友基于tesseract封装了一个Python的包pytesseract,直接开箱即用，融入爬虫程序中。
百闻不如一run
ps(这里使用的操作系统是Ubuntu16.04；Python版本是2.7)
直接 pip install pytesseract 然后Python图片处理要用到PIL(Python Imaging Library) pip install PIL
原图片

ocr.gif
写个简单的测试demo

code.png
看下识别结果

error.png
报错了，根据报错信息来看，是确实了什么文件，或者依赖lib
我跟踪了pytesseract的代码，发现是少了C++提供的OCR服务，因为pytesseract是调用的tesseract(C++写的)
然后安装tesseract sudo apt install tesseract
再run一下代码

pyocr_res.png

整体结果还可以（倒数第四位识别错了），再训练一下准确率就更高了。
预知后事如何，且听下回分解

OCR从入门到不精通
最近在爬某网站，老是蹦出来验证码，就想着找个OCR破了这个验证码，然后就开始了OCR探索之旅。首先简单说一下什么...
同源建模、分子对接和分子模拟方法教程往期回顾
同源建模基础教程: 同源建模从入门到精通（一）同源建模从入门到精通 (二) 同源建模从入门到精通（三）同源...
“从入门到精通”——西暮
在书店中，有很多的书都有这样的书名：《***，从入门到精通》。诸如《PS，从入门到精通》《Python,从入门到...
《疯狂Java：突破程序员基本功的16课(修订版)》Java著名
JavaScript从入门到精通公众号回复“41503”获取下载地址《JavaScript从入门到精通》从初学...
《Android开发从入门到精通》作者: 扶松柏
Android开发从入门到精通作者:扶松柏[中文pdf] 《Android开发从入门到精通》定位于Android...
Vim 从入门到精通
《Vim 从入门到精通》
《SQL Server从入门到精通》PDF高清完整版-免费下载
《SQL Server从入门到精通》PDF高清完整版-免费下载《SQL Server从入门到精通》PDF高清完整...
《SQL Server从入门到精通》PDF高清完整版-免费下载
《SQL Server从入门到精通》PDF高清完整版-免费下载《SQL Server从入门到精通》PDF高清完整...
10本Android开发类图书资料，供Android开发者参考学
《Android开发从入门到精通》《Android开发从入门到精通》系统讲解了Android软件开发的基础知识，...
Blue教程汇总
【JavaScript从入门到精通】第二十四课 JS面向对象基础-01 【JavaScript从入门到精通】第二十...

网友评论

众益鑫:学习学习

知傲:tessreact是比较优秀的库了，另外可以看看微软提供的一个api

知傲:@吴钧泽 https://www.microsoft.com/cognitive-services/en-us/computer-vision-api#Analysis

吴钧泽:@zhao0 嗯微软的API 方便发个链接吗？

0435a37fba98:我想问下你用的python IDE是那个！推荐下

吴钧泽:@VincentGDUT pycharm Android studio 都是JetBrains 出的开发工具

0435a37fba98: @吴钧泽看起来很像Android Studio

吴钧泽:@VincentGDUT pycharm

众益鑫:学习学习
知傲:tessreact是比较优秀的库了，另外可以看看微软提供的一个api
知傲:@吴钧泽 https://www.microsoft.com/cognitive-services/en-us/computer-vision-api#Analysis
吴钧泽:@zhao0 嗯微软的API 方便发个链接吗？
0435a37fba98:我想问下你用的python IDE是那个！推荐下
吴钧泽:@VincentGDUT pycharm Android studio 都是JetBrains 出的开发工具
0435a37fba98: @吴钧泽看起来很像Android Studio
吴钧泽:@VincentGDUT pycharm

OCR从入门到不精通

首先简单说一下什么是OCR

OCR识别的验证码原理

OCR识别验证码的具体操作

相关文章

OCR从入门到不精通

同源建模、分子对接和分子模拟方法教程往期回顾

“从入门到精通”——西暮

《疯狂Java：突破程序员基本功的16课(修订版)》Java著名

《Android开发从入门到精通》作者: 扶松柏

Vim 从入门到精通

《SQL Server从入门到精通》PDF高清完整版-免费下载

《SQL Server从入门到精通》PDF高清完整版-免费下载

10本Android开发类图书资料，供Android开发者参考学

Blue教程汇总

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

『StuQ技术人写作输出行动计划』大本营

iOS学习

编程娱乐

代码与远方

程序员

今日看点

iOS 开发

iOS 干货整理