美文网首页Python新世界python热爱者Python
腾讯内部技术,Python提取图片中的文字信息,一行代码搞定!

腾讯内部技术,Python提取图片中的文字信息,一行代码搞定!

作者: 48e0a32026ae | 来源:发表于2018-10-19 16:21 被阅读3次

    用过手机QQ就知道,点击一个图片会弹出一个小功能,那就是提取图片中的文字。非常方便实用,那么很难实现吗?

    利用Python提取图片中的文字信息,只需要一行代码就能搞定!

    当然,这是吹牛皮的,但是真正的Python代码也就第4行,说是一行代码搞定也没错。

    示例:

    效果

    尽管运行Python代码后也有几个错误的地方,但是大部分是识别正确的。

    你以为就这样结束了吗?那这么简单,我都不用出教程了。一行代码实现这个功能当然也是要有前戏的。

    一,pytesseract和PIL的安装

    pip安装

    2,pycharm编辑器能够快速安装,这就看你是否用pycharm了。

    pycharm的Settings设置页按照下面步骤操作

    安装好了pytesseract,安装PIL在上面第三步里搜索PIL并点击安装就可以了。

    安装好了所有库,运行下面Python代码

    出现报错

    可以看到提示:未安装识别引擎tesseract-ocr

    二,安装识别引擎tesseract-ocr

    1.网上下载安装包,然后直接点击安装即可

    因为tesseract-ocr默认不支持中文识别,所以解压安装tesseract-ocr后还需做如下操作

    2,安装完成tesseract-ocr后,我们还需配置好

    打开后做如下操作

    当然也能由pycharm快速打开pytesseract.py

    第一步:

    第二步:

    第三步:

    现在已经完成了所有配置,运行下面Python代码即可实现图片里的文字提取

    本文到此就结束了,希望各位Python越学越好,早日达成梦想。

    相关文章

      网友评论

      • 凉城的夜:骗子小编,这哪是腾讯内部,标题党。。。

      本文标题:腾讯内部技术,Python提取图片中的文字信息,一行代码搞定!

      本文链接:https://www.haomeiwen.com/subject/jbfuzftx.html