①安装PIL:
pip install Pillow
②安装pytesser3:pip install pytesser3
③安装pytesseract:pip install pytesseract
④安装autopy3:
1.先安装wheel:pip install wheel
2.安装Tesseract-OCR:百度直接搜索Tesseract-OCR下载即可,比如:点击这里
这里要说明的是安装Tesseract-OCR
后,其不会被默认添加至环境变量path中,会导致报错!!!
解决办法有两种:(先找到
image.pngTesseract-OCR
安装文件夹,再找到tesseract.exe
文件)
我这里的绝对路径是:D:\python\Tesseract-OCR\tesseract.exe
①将此路径添加至环境变量path中(不过我是这么做的,但是PyCharm仍旧报错)
②找到pytesseract.py
文件
我这里是C:\Users\admin\AppData\Local\Programs\Python\Python36\Lib\site-packages\pytesseract\pytesseract.py
需要注意的是上图路径中的必须是这个‘/’而不是‘\’
进入正题,如何识别图像中文字
将下面的图片上的文字识别并打印出来:
aa.jpg
代码如下:
# _*_ coding:utf-8 _*_
import pytesseract
from PIL import Image
__author__ = 'admin'
im = Image.open(r'C:\Users\Administrator\Desktop\aa.jpg') #这里必须是反斜杠
print(pytesseract.image_to_string(im))
结果如下图:
image.png
网友评论