今天,我们用Python实现对图像文字的识别,很简单!利用的库是pillow和pytesseract。pytesseract需要从网上下载,也很方便。
学习Python中有不明白推荐加入交流群
号:960410445
群里有志同道合的小伙伴,互帮互助,
群里有不错的视频学习教程和PDF!
image
识别图中的唐诗,具体代码如下:
from PIL import Image
import pytesseract
文字识别 text=pytesseract.image_to_string(Image.open('白居易.jpg'),lang='chi_sim')
print(text)
print("".join(text.split()))
运行效果:
image基本上所有的文字都能识别,当然不可避免也会有一些乱字出现,这个库对于识别文字的能力还需提高,但简单的识别验证码肯定没问题了。后期,我们会利用这个库来识别验证码 ,达到绕过验证码自动登陆的效果。
好了,See you!
网友评论