美文网首页
使用Tess4J碰到的各路问题

使用Tess4J碰到的各路问题

作者: supory | 来源:发表于2017-09-08 17:00 被阅读868次

背景:项目需要扫描识别技术,比较了微软(智能识别技术)和谷歌的(Tess4J),决定使用这个开源的东东。

建议:

1、可以到GitHub找相关的Tess4J项目

2、到Tess4J官方下载最新的包,查看示例代码 http://tess4j.sourceforge.net/

3、到Tess4J官网下载示例代码 https://sourceforge.net/projects/tess4j/ 速度比较慢

4、指导页面,对应编辑器,建立简单代码 http://tess4j.sourceforge.net/tutorial/

一、项目结构:使用eclipse 构建java项目,下图为项目结构

构建TestTess4j.java,(勾选作为main函数)

public class TestTess4j {

public static void main(String args[]) {

File imageFile = new File("eurotext.tif");

Tesseract instance = Tesseract.getInstance();

try {

String result = instance.doOCR(imageFile);

System.out.println(result);

} catch (Exception e) {

System.err.println(e.getCause());

}

}

}

右击运行,java application ,选择你的main类,TestTess4j。

输出成功。

注意:jar包和dll文件是对应的,更高版本的dll文件在jar包中,可以不引用dll文件。

二、创建web项目,引用具有多个API接口类的Tess4J项目。

三、整个过程碰到的问题

1、找不到tess4j

原因,仅仅在class path中引入了jar包,没有在WEB-INF的lib目录下拷贝jar包,总是报错。

2、找不到模块

一个jar包,对应一个dll,每个dll版本不同名称不同,系统也区分32--64,在LoadLibs.java中有

这个302代表的是和jar包对应的dll文件

如果不清楚版本号,可以使用ZAR打开jar包,查看里面的dll文件名称。

注意:lept4j.jar 和test4J.jar的版本要对应,因为它们里面打包了dll文件,需要匹配。

3、Invalid memory access

这个属于tessract实例化的时候,默认找不到tessdata包,因为这个包里面有对应的语言训练包,需要指定

这里直接使用了绝对路径

4、java.jna.pointer报错

这个是因为tess4j的jar包问题,需要更换对应的版本

5、java.lang.UnsatisfiedLinkError 

这个是因为dll文件不能正常加载的问题,这个有很多可能性

(1)、dll文件和你本地系统的c++环境不匹配,不同的libtesseract3**貌似使用的是不同版本的vs编辑器,

我的302最终,我重新到微软的官网下载了运行的配件 

这个是2013组件地址 https://www.microsoft.com/zh-cn/download/details.aspx?id=40784

 (2)、dll文件缺失或者错误匹配

例如302.dll需要匹配168

而305则需要匹配174

这个可以通过dll检测软件来查询,

找对应的dll文件

https://sourceforge.net/projects/tess4j/files/lept4j/

使用Dependency Walker工具查看DLL文件,通过软件打开libtesseract302.dll如果缺少liblept***.dll则会出现黄色叹号,

(3)你的系统可能缺少必要的dll文件,通过刚才的软件,打开dll后,看到黄色叹号,表示缺少软件

经测试,有叹号的情况也能正常运行。

三、web项目的目录结构

相关文章

网友评论

      本文标题:使用Tess4J碰到的各路问题

      本文链接:https://www.haomeiwen.com/subject/ngxnjxtx.html