Python实现文字识别
1.pip install pytesseract
2.从https://digi.bib.uni-mannheim.de/tesseract/下载
| tesseract-ocr-w64-setup-v5.0.0.20211201.exe |
从https://esseract-ocr.github.io/tessdoc/Data-Files.html下载语言数据文件| chi_sim.traineddata |
3.python源码
from PIL import Image
import pytesseract
def imageToStr(image_url, lang):
im = Image.open(image_url)
im = im.convert('L')
im_str = pytesseract.image_to_string(im, lang=lang)
return im_str
#
img_str = imageToStr('01.png','eng')
print('识别到的英文',img_str)
print('识别到的中文')
cn_img_str = imageToStr('02.png','chi_sim_vert')
print(cn_img_str)
网友评论