Tess4J OCR简单使用教程

作者: chengjian666 | 来源:发表于2017-06-26 00:35 被阅读2324次

Tess4J OCR简单使用教程
Spring和Ocr整合详解
JAVA使用Tess4J进行ocr识别
详细教程:Java如何使用Tess4J进行ocr识别
autojs哪里想读点哪里
autojs-ocr-easyedge-nodejs
Tesseract-OCR（图像文字识别）
autojs识别数字ocr
Tesseract OCR（光学字符识别）
Java OCR文字识别（Tess4J）

Tess4J简介

Tesseract-OCR支持中文识别，并且开源和提供全套的训练工具，是快速低成本开发的首选。而Tess4J则是Tesseract在Java PC上的应用。在英文和数字识别中性能还是不错的，但是在中文识别中，无论速度还是识别率还是较弱，建议有条件的话，针对场景进行训练，会获得较好结果，本文仅对目前Tess4J的用法进行介绍。

使用教程

1.去Tess4J官网下载源码包

前往：Tess4J 官网下载最新的Tess4J的源码包，其中包含Java代码,jar,dll等，大概结构如下：

image

2.创建Java项目并配置

网上不少文章会提到DLL，其实在最新的版本，如果源码包里面有dist路径，则只需要配置该jar包和lib中相关的jar即可。

注意点1：将dist/tess4j-3.4.0.jar 及 lib/*.jar加入项目

注意点2：tessdata一定要配置到根目录，否则需要在代码中指定dataPath

  ITesseract instance = new Tesseract();
instance.setDatapath("the absolute path of tessdata");

注意点3：无需将源码包拷贝到项目中，可能会出错

所以最终的目录结构如下：

image

3.尝试写一个Demo

可以按照官网的示例，直接编写一个Demo试一下效果：

public class OCRDemo {

    public static void main(String[] args) throws TesseractException {
        ITesseract instance = new Tesseract();
        //如果未将tessdata放在根目录下需要指定绝对路径
        //instance.setDatapath("the absolute path of tessdata");
        // 我们需要指定识别语种
        instance.setLanguage("chi_sim");
        // 指定识别图片
        File imgDir = new File("test_chinese_07.PNG");
        long startTime = System.currentTimeMillis();
        String ocrResult = instance.doOCR(imgDir);
        // 输出识别结果
        System.out.println("OCR Result: \n" + ocrResult + "\n 耗时：" + (System.currentTimeMillis() - startTime) + "ms");
    }
}

其中注意三处：

tessdata放在与src同级的根目录下，否则需要指定dataPath
如果需要识别英文之外的语种，需要指定识别语种；
其他语种下载地址：其他语种下载地址

附录：
本项目百度云下载链接

网友评论

本文标题：Tess4J OCR简单使用教程

本文链接：https://www.haomeiwen.com/subject/nrkdcxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Tess4J OCR简单使用教程

Tess4J简介

使用教程

1.去Tess4J官网下载源码包

2.创建Java项目并配置

注意点1：将dist/tess4j-3.4.0.jar 及 lib/*.jar加入项目

注意点2：tessdata一定要配置到根目录，否则需要在代码中指定dataPath

注意点3：无需将源码包拷贝到项目中，可能会出错

3.尝试写一个Demo

相关文章

Tess4J OCR简单使用教程

Spring和Ocr整合详解

JAVA使用Tess4J进行ocr识别

详细教程:Java如何使用Tess4J进行ocr识别

autojs哪里想读点哪里

autojs-ocr-easyedge-nodejs

Tesseract-OCR（图像文字识别）

autojs识别数字ocr

Tesseract OCR（光学字符识别）

Java OCR文字识别（Tess4J）

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读