Android OCR之tesseract章

作者: lavor | 来源:发表于2016-05-20 11:06 被阅读662次

    Android OCR之tesseract


    1. 开源工具简介


    tesseract是非常有名的开源OCR工具,但是要将它配置到Android开发环境中可能要费点功夫,别担心,github上面有好人帮助我们封装了Android开发环境的tesseract配置,这就是Android平台上OCR开源项目tess-two

    2. 环境配置


    利用tess-two配置OCR环境非常简单。

    • 首先,设置工程的ndk路径。
    • 其次,在模块中添加依赖:compile 'com.rmtheis:tess-two:6.0.0'

    3. 数据准备


    要进行OCR还要获取训练数据tessdata,下载该训练数据,到时候将训练数据弄到自己的Android设备上就行了。

    注意:不要把所有训练数据都弄到Android设备上,因为训练数据比较大,需要用到什么语言的数据就只把这些语言对应的数据弄到Android设备上。

    比如,我一般识别只用到识别英文与简体中文,因此只需要将eng.traineddata,chi_sim.traineddata弄到Android设备上就行了。

    4. 开始Android OCR之旅


    相关常量设置:

        //训练数据路径,必须包含tesseract文件夹
        static final String TESSBASE_PATH = "/storage/emulated/0/Download/tesseract/";
        //识别语言英文
        static final String DEFAULT_LANGUAGE = "eng";
        //识别语言简体中文
        static final String CHINESE_LANGUAGE = "chi_sim";  
    

    英文识别:

         public void EnglishOCR(){
            //设置图片可以缓存
            english.setDrawingCacheEnabled(true);
            //获取缓存的bitmap
            final Bitmap bmp = english.getDrawingCache();
            final TessBaseAPI baseApi = new TessBaseAPI();
            //初始化OCR的训练数据路径与语言
            baseApi.init(TESSBASE_PATH, DEFAULT_LANGUAGE);
            //设置识别模式
            baseApi.setPageSegMode(TessBaseAPI.PageSegMode.PSM_SINGLE_LINE);
            //设置要识别的图片
            baseApi.setImage(bmp);
            english.setImageBitmap(bmp);
            englishtext.setText(baseApi.getUTF8Text());
            baseApi.clear();
            baseApi.end();
         }  
    

    简体中文识别与英文识别类似。

    5. 程序界面


    程序源代码下载:https://github.com/lavor-zl/FunctionsDemo

    相关文章

      网友评论

      • 76fb133613ae:已设置ndk路径,直接studio下载的
        但是报错:Tesseract(native): Could not initialize Tesseract API with language=eng!
      • c8112c64d105:你好,我把demo下载下来测试时初始化语言那一行会出错呢,说路径不对呢?这个怎么解决呀麻烦回答一下哦,谢谢!
      • 聪葱忙忘:"训练数据都弄到Android设备上",直接放就可以?不用放在项目里面指定路径吗
      • dd61ef7c40ca:demo,一点就崩~~怎么:sweat:
      • KUN叔:不需要什么ndk build拿到.so的文件什么的吗?
      • ytuio21:请问一下设置工程的ndk路径怎么做啊?没学过ndk,直接compile老是失败
        lavor:@ytuio21 先下载NDK
        lavor:@ytuio21 在AndroidStudio下面点击File->Project Structure->SDK Location,然后就可以看到“Android NDK Location”,在里面设置NDK路径就行了,前提你要先现在NDK
      • lavor:本人简书专题:Android技术漫谈,欢迎大家多多关注。有Android方面的文章可以尽情的往上面投递。

      本文标题:Android OCR之tesseract章

      本文链接:https://www.haomeiwen.com/subject/uacnrttx.html