随着OCR技术的发展,图片验证码这种验证方式已经满足不了网站的验证需求了,输入验证码在这件事完全可以用机器来代替,只需要简单的几行代码就可以实现。
例如本案例,只需5行Python代码就可以将图片验证码读取出来。
# -*- coding: UTF-8 -*-
import pytesseract
from PIL import Image
image = Image.open('rand.png')
vcode = pytesseract.image_to_string(image)
print (vcode)
验证码图片
rand.png读取效果图
img.png是不是超级简单
但是要想实现这么强大的功能,我们的机器上得装有Python的环境,本人是在windows下安装的Python 3.6.0版本
Python下载地址 https://www.python.org/downloads/windows/
安装完成之后添加环境变量,使Python命令能够在全局使用
pythonPath.png配置完成之后我们还需要通过pip
去安装两个读取验证码所用到的依赖,Pillow
和pytesseract
,pip
在Python 3.6.0里已经集成了,直接在控制台使用就可以
pip install Pillow
pip install pytesseract
注意
要安装pytesseract
库,必须先安装其依赖的Pillow
及tesseract-ocr
,tesseract-ocr
则为谷歌的OCR识别引擎,下载后直接下一步下一步安装就可以了。
tesseract-ocr网盘下载链接:http://pan.baidu.com/s/1i5ojcDf 密码:a8cw
另外说一下PIL这个图像处理库非常强大,api简单易用,可以实现将图片转换成字符图。
原图片
github.png转换后
git.png代码就不贴了,大家自行百度去吧,相关代码太多了。
网友评论