pyocr-OCR字符识别库

作者: 梁新彦 | 来源:发表于2018-02-23 15:23 被阅读43次

pyocr-OCR字符识别库
关于Tesseract
【OCR】AI产品经理CV通识（四）
5分钟用Python搭建一个OCR服务器，可以直接截图中提取文本
Python 实现字符识别—Part3
Python 5分钟搭建OCR服务器，基本破解简单的验证码！
组队学习之街景字符编码识别赛题理解
1.利用Tesseract进行图像识别OCR
OCR之SwiftOCR
python库介绍-pytesseract: OCR光学字符识别

pyocr github: is an optical character recognition (OCR) tool wrapper for python. That is, it helps using various OCR tools from a Python program.

安装

安装Tesseract OCR github

On Linux

sudo apt-get install tesseract-ocr

安装pyocr

pip install pyocr

问题

如果发现识别不准确，表现为：总是将某一字符识别为另一个字符，如1总是识别为3.

解决办法: 调整图片的大小。


from PIL import Image
import sys

import pyocr
from pyocr.builders import DigitBuilder,TextBuilder

tools = pyocr.get_available_tools()
if len(tools) == 0:
    print("No OCR tool found")
    sys.exit(1)
# The tools are returned in the recommended order of usage
tool = tools[0]
print("Will use tool '%s'" % (tool.get_name()))
# Ex: Will use tool 'libtesseract'

langs = tool.get_available_languages()
print("Available languages: %s" % ", ".join(langs))
lang = langs[0]
# print("Will use lang '%s'" % (lang))
# Ex: Will use lang 'fra'
# Note that languages are NOT sorted in any way. Please refer
# to the system locale settings for the default language
# to use.

import numpy as np

from PIL import Image, ImageDraw, ImageFont

import matplotlib
matplotlib.use('TkAgg')
import matplotlib.pyplot as plt
def get_img(n, img_sz):
  im = np.ones(img_sz)
  im[:,:]=255
  pil_im = Image.fromarray(im)
  draw = ImageDraw.Draw(pil_im)
  font = ImageFont.truetype("DejaVuSans.ttf", size=12)
  sz = font.getsize(str(n))
  draw.text((img_sz[1]-sz[0], 2), str(n), font=font,fill=0)
  im = np.asarray(pil_im)
  return im

import cv2
count = 0
with open('a.txt','w') as  f:
    for i in range(10000):
        text = np.random.randint(0, 4999999, dtype=np.int)
        im = get_img(text, (15,60))
        # im.show()
        im = cv2.resize(im,(120,40)) #调整分辨率，直到将字符都识别对
        i_n = str(i)+'.jpg'
        # plt.imsave(i_n,np.array(im))
        cv2.imwrite(i_n,im)
        f.write(i_n)
        f.write('\n')   
        digits = tool.image_to_string(
            Image.fromarray(im),
            lang='eng',
            builder=DigitBuilder(tesseract_layout=3),
        )
        print(str(text),'---', digits)
        if str(text) in digits:
            count+=1
print(count)
#
# print(digits)

 # tesseract a.txt ./ --oem 0 -l eng -c tessedit_char_whitelist=0123456789