美文网首页
python3.6 图片识别转文本

python3.6 图片识别转文本

作者: 夜空最亮的9星 | 来源:发表于2018-12-08 19:34 被阅读41次

python3.6 图片识别转文本

环境

conda + python3.6 + jupyter notebook
安装依赖
pip install pillow

pip install tesseract

pip install pytesseract

Installation 图片识别引擎

For CentOS 7 run the following as root:

yum-config-manager --add-repo https://download.opensuse.org/repositories/home:/Alexander_Pozdnyakov/CentOS_7/
sudo rpm --import https://build.opensuse.org/projects/home:Alexander_Pozdnyakov/public_key
yum update
yum install tesseract 
yum install tesseract-langpack-deu

安装完成后配置环境变量:

vim /etc/profile

export TESSDATA_PREFIX="/usr/share/tesseract/4/tessdata"
export PATH=$PATH:$TESSDATA_PREFIX

检查当前语言包:tesseract --list-langs

(python36) [root@centos-7 ~]# tesseract --list-langs
List of available languages (3):
chi_sim
eng
osd
(python36) [root@centos-7 ~]# 

下载语言库将语言包拷贝到/usr/share/tesseract/4/tessdata目录下

image

运行代码:

# -*- coding: utf-8 -*-
from PIL import Image

import pytesseract

#上面都是导包,只需要下面这一行就能实现图片文字识别
text=pytesseract.image_to_string(Image.open('img1.jpg'),lang='chi_sim') #设置为中文文字的识别

#text=pytesseract.image_to_string(Image.open('test.png'),lang='eng')   #设置为英文或阿拉伯字母的识别

print(text)

遍历一个目录:

from PIL import Image
import pytesseract
import os

path="/home/imgs"
file_list=os.listdir(path)
fo=open("data.txt","w")

for file in file_list:
    text=pytesseract.image_to_string(Image.open(os.path.join(path,file)),lang='chi_sim')
    print(text)
    fo.write(text)
fo.close

相关文章

  • python3.6 图片识别转文本

    python3.6 图片识别转文本 环境 安装依赖 Installation 图片识别引擎 For CentOS ...

  • 身份证识别设计思路

    1:传统opencv的方式, 传统:图片 文本 拆分字符 单字符识别神经网络:图片 文本 文本识别形态学操作法:...

  • 快速实现图片局部识别的教程

    应该如何快速实现图片局部识别呢?图片局部识别就是将图片上需要用到的文字进行图片局部识别转换成可以编辑的文本格...

  • python 使用百度AI接口实现图片文字识别

    python 使用百度AI接口实现图片文字识别 功能: 输入一张图片,识别其中的文字,转换成json文本。 参考百...

  • iOS14 Vision

    在iOS11的时候苹果引入了Vision框架,可以人脸监测识别、图片分析、条形码识别、文本识别。是人工智能(Cor...

  • 用python3爬虫

    识别网站所用技术 python3.6 安装builtwith模块 import builtwithbuiltwit...

  • NLP

    本地搜索 文本匹配, 与 文本 转化为 声音 匹配。 与 语音识别翻译 ML:搜索识别, 语音识别,文字识别,图像...

  • 双层PDF转换方法

    双层PDF转换方法 一. 打开PDF文件——导出JPEG——全选导出的图片——合并 ——增强扫描——识别文本——在...

  • 做生物必须要注意的Excel的坑

    Excel会自动识别用户的文本内容,来判断文本的数据类型,然后会自动变更为对应的数据类型。例如: 输入的文本自动转...

  • 【免费工具】百度文字识别工具

    百度文字识别工具 v0.0.1 [下载链接] 更新 增加表格识别功能 [图片转excel] 参考教程 [只要10分...

网友评论

      本文标题:python3.6 图片识别转文本

      本文链接:https://www.haomeiwen.com/subject/xyqchqtx.html