美文网首页程序员Android Other爬虫
tess_two Android图片文字识别

tess_two Android图片文字识别

作者: 喵了个呜s | 来源:发表于2017-03-16 18:40 被阅读4398次

    文字识别一般都用的tesseract-ocr。
    GitHub:https://github.com/tesseract-ocr/tesseract
    而Android对应的比较推荐的有个tess-two。
    GitHub:https://github.com/rmtheis/tess-two

    Demo的github地址:https://github.com/wangyisll/TessTwoDemo

    先看效果图

    我主要是识别截图,所以图片比较规范,识别率应该很高。

    ![Screenshot_2017-03-17-16-53-25-879_com.sunlinlin..png](http:https://img.haomeiwen.com/i2062943/5e205d16418fb691.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

    简介什么都不说了,直接看简单的用法吧


    首先肯定是引入依赖了

    dependencies {
        compile 'com.rmtheis:tess-two:6.2.0'
    }
    

    简单的用法其实就几行代码:

    TessBaseAPI tessBaseAPI = new TessBaseAPI();
    tessBaseAPI.init(DATAPATH, DEFAULT_LANGUAGE);//参数后面有说明。
    tessBaseAPI.setImage(bitmap);
    String text = tessBaseAPI.getUTF8Text();
    

    就这样简单的把一个bitmap设置进去,就能识别到里面的文字并输出了。
    但是真正用的时候还是遇到了点麻烦,虽然只是简单的识别。
    主要是tessBaseAPI.init(DATAPATH, DEFAULT_LANGUAGE)这个方法容易出错。
    先看一下这个方法的源码吧:

    public boolean init(String datapath, String language) {
            return init(datapath, language, OEM_DEFAULT);
        }
    /**
         * Initializes the Tesseract engine with the specified language model(s). Returns
         * <code>true</code> on success.
         *
         * @see #init(String, String)
         *
         * @param datapath the parent directory of tessdata ending in a forward
         *            slash
         * @param language an ISO 639-3 string representing the language(s)
         * @param ocrEngineMode the OCR engine mode to be set
         * @return <code>true</code> on success
         */
        public boolean init(String datapath, String language, int ocrEngineMode) {
            if (datapath == null)
                throw new IllegalArgumentException("Data path must not be null!");
            if (!datapath.endsWith(File.separator))
                datapath += File.separator;
    
            File datapathFile = new File(datapath);
            if (!datapathFile.exists())
                throw new IllegalArgumentException("Data path does not exist!");
    
            File tessdata = new File(datapath + "tessdata");
            if (!tessdata.exists() || !tessdata.isDirectory())
                throw new IllegalArgumentException("Data path must contain subfolder tessdata!");
    
            //noinspection deprecation
            if (ocrEngineMode != OEM_CUBE_ONLY) {
                for (String languageCode : language.split("\\+")) {
                    if (!languageCode.startsWith("~")) {
                        File datafile = new File(tessdata + File.separator + 
                                languageCode + ".traineddata");
                        if (!datafile.exists())
                            throw new IllegalArgumentException("Data file not found at " + datafile);
                    }
                }
            }
    
            boolean success = nativeInitOem(mNativeData, datapath, language, ocrEngineMode);
    
            if (success) {
                mRecycled = false;
            }
    
            return success;
        }
    

    注意

    从下面的方法中抛出的几个异常可以看出来,初始化的时候,第一个参数是个文件夹,而且这个文件夹中必须有一个tessdata的文件夹;而且这个文件夹中要有个文件叫做 第二个参数.traineddata 。具体的可以看下面代码里的注释。这些文件夹和文件没有的一定要创建好,不然会报错。

    第二个参数.traineddata 是个什么文件呢?
    这个是识别用到的语言库还是文字库什么的,按那个初始化方法的意思是哟啊放到SD卡中的。可以在下面的地址下载。我的demo里把这个文件放在了assets中,启动的时候复制到内存卡里。
    https://github.com/tesseract-ocr/tessdata

    chi_sim.traineddata应该是健体中文吧,我用的是这个。中英文都能识别。

    代码

    下面是主要代码:

    import android.Manifest;
    import android.content.pm.PackageManager;
    import android.graphics.Bitmap;
    import android.graphics.BitmapFactory;
    import android.os.Build;
    import android.os.Bundle;
    import android.os.Environment;
    import android.support.annotation.NonNull;
    import android.support.v7.app.AppCompatActivity;
    import android.util.Log;
    import android.view.View;
    import android.widget.Button;
    import android.widget.TextView;
    
    import com.googlecode.tesseract.android.TessBaseAPI;
    
    import java.io.File;
    import java.io.FileOutputStream;
    import java.io.IOException;
    import java.io.InputStream;
    import java.io.OutputStream;
    
    public class MainActivity extends AppCompatActivity {
    
        private static final String TAG = "MainActivity";
        private Button btn;
        private TextView tv;
    
        /**
         * TessBaseAPI初始化用到的第一个参数,是个目录。
         */
        private static final String DATAPATH = Environment.getExternalStorageDirectory().getAbsolutePath() + File.separator;
        /**
         * 在DATAPATH中新建这个目录,TessBaseAPI初始化要求必须有这个目录。
         */
        private static final String tessdata = DATAPATH + File.separator + "tessdata";
        /**
         * TessBaseAPI初始化测第二个参数,就是识别库的名字不要后缀名。
         */
        private static final String DEFAULT_LANGUAGE = "chi_sim";
        /**
         * assets中的文件名
         */
        private static final String DEFAULT_LANGUAGE_NAME = DEFAULT_LANGUAGE + ".traineddata";
        /**
         * 保存到SD卡中的完整文件名
         */
        private static final String LANGUAGE_PATH = tessdata + File.separator + DEFAULT_LANGUAGE_NAME;
    
        /**
         * 权限请求值
         */
        private static final int PERMISSION_REQUEST_CODE=0;
    
        @Override
        protected void onCreate(Bundle savedInstanceState) {
            super.onCreate(savedInstanceState);
            setContentView(R.layout.activity_main);
            btn = (Button) findViewById(R.id.btn);
            tv = (TextView) findViewById(R.id.tv);
    
            if (Build.VERSION.SDK_INT >= 23) {
                if (checkSelfPermission(Manifest.permission.READ_EXTERNAL_STORAGE) != PackageManager.PERMISSION_GRANTED ||
                        checkSelfPermission(Manifest.permission.WRITE_EXTERNAL_STORAGE) != PackageManager.PERMISSION_GRANTED) {
                    requestPermissions(new String[]{Manifest.permission.WRITE_EXTERNAL_STORAGE, Manifest.permission.READ_EXTERNAL_STORAGE}, PERMISSION_REQUEST_CODE);
                }
            }
    
            //Android6.0之前安装时就能复制,6.0之后要先请求权限,所以6.0以上的这个方法无用。
            copyToSD(LANGUAGE_PATH, DEFAULT_LANGUAGE_NAME);
    
            btn.setOnClickListener(new View.OnClickListener() {
                @Override
                public void onClick(View v) {
                    new Thread(new Runnable() {
                        @Override
                        public void run() {
                            Log.i(TAG, "run: kaishi " + System.currentTimeMillis());
    
                            Bitmap bitmap = BitmapFactory.decodeResource(getResources(), R.drawable.quanbu);
                            Log.i(TAG, "run: bitmap " + System.currentTimeMillis());
    
                            TessBaseAPI tessBaseAPI = new TessBaseAPI();
    
                            tessBaseAPI.init(DATAPATH, DEFAULT_LANGUAGE);
    
                            tessBaseAPI.setImage(bitmap);
                            final String text = tessBaseAPI.getUTF8Text();
                            Log.i(TAG, "run: text " + System.currentTimeMillis() + text);
                            runOnUiThread(new Runnable() {
                                @Override
                                public void run() {
                                    tv.setText(text);
                                }
                            });
    
                            tessBaseAPI.end();
                        }
                    }).start();
                }
            });
    
        }
    
        /**
         * 将assets中的识别库复制到SD卡中
         * @param path  要存放在SD卡中的 完整的文件名。这里是"/storage/emulated/0//tessdata/chi_sim.traineddata"
         * @param name  assets中的文件名 这里是 "chi_sim.traineddata"
         */
        public void copyToSD(String path, String name) {
            Log.i(TAG, "copyToSD: "+path);
            Log.i(TAG, "copyToSD: "+name);
    
            //如果存在就删掉
            File f = new File(path);
            if (f.exists()){
                f.delete();
            }
            if (!f.exists()){
                File p = new File(f.getParent());
                if (!p.exists()){
                    p.mkdirs();
                }
                try {
                    f.createNewFile();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
    
            InputStream is=null;
            OutputStream os=null;
            try {
                is = this.getAssets().open(name);
                File file = new File(path);
                os = new FileOutputStream(file);
                byte[] bytes = new byte[2048];
                int len = 0;
                while ((len = is.read(bytes)) != -1) {
                    os.write(bytes, 0, len);
                }
                os.flush();
            } catch (IOException e) {
                e.printStackTrace();
            } finally {
                try {
                    if (is != null)
                        is.close();
                    if (os != null)
                        os.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
    
        }
    
        /**
         * 请求到权限后在这里复制识别库
         * @param requestCode
         * @param permissions
         * @param grantResults
         */
        @Override
        public void onRequestPermissionsResult(int requestCode, @NonNull String[] permissions, @NonNull int[] grantResults) {
                Log.i(TAG, "onRequestPermissionsResult: "+grantResults[0]);
            switch (requestCode){
                case PERMISSION_REQUEST_CODE:
                    if (grantResults.length>0&&grantResults[0]==PackageManager.PERMISSION_GRANTED){
                        Log.i(TAG, "onRequestPermissionsResult: copy");
                        copyToSD(LANGUAGE_PATH, DEFAULT_LANGUAGE_NAME);
                    }
                    break;
                default:
                    break;
            }
        }
    }
    
    

    demo下载地址

    http://download.csdn.net/detail/qq_25806863/9783651

    相关文章

      网友评论

      • 嘿嘿_0a59:tesseract-ocr和tess-two软件代码深度优化
        tesseract-ocr是目前做得最好的一款开源OCR软件,包括PC版本和Android版本tess-two。但是由于1)包含了较为复杂的页面分析;2)最早为英语开发,后扩展到多种语言,需要适应的范围广,导致其用于汉字OCR时速度较慢、效率较低。按不同的电脑配置,10个汉字需要2~5秒。本人之前由于项目需要,对tesseract-ocr源代码进行了深入的学习分析,可根据特定的应用场景对tesseract-ocr和tess-two进行核心代码层级的优化,使运行效率提高一个数量级。本人之前的项目,原生代码识别10个汉字需要2~3秒,优化后运行时间为100~200毫秒。详细情况可以联系我QQ34841693。
        e1ddbd1bfac4:在这BB毛呢
      • 4b84bd099fef:这个错误有什么办法可以解决?
        Error:A problem occurred configuring root project 'TessTwoDemo-master'.
        > Could not resolve all dependencies for configuration ':classpath'.
        > Could not resolve com.android.tools.build:gradle:2.3.0.
        Required by:
        project :
        > Could not resolve com.android.tools.build:gradle:2.3.0.
        > Could not get resource 'https://jcenter.bintray.com/com/android/tools/build/gradle/2.3.0/gradle-2.3.0.pom'.
        > Could not GET 'https://jcenter.bintray.com/com/android/tools/build/gradle/2.3.0/gradle-2.3.0.pom'.
        > Connect to 127.0.0.1:8787 [/127.0.0.1] failed: Connection refused: connect
      • 4b84bd099fef:你好,导入你的代码一直有
        Gradle 'TessTwoDemo-master' project refresh failed
        Error:Connection refused :Connect
        可以帮忙看看嘛
        喵了个呜s:@好姑娘光芒万丈_ada3 应该是我设置了代理的问题
      • 彳_25f4:下载地址没了耶,求楼主发一下源码 522403009@qq.com ,不胜感激
        喵了个呜s:@彳_25f4 github上有呀?
      • 七岁就狠拽:想问问楼主最后把这功能用到项目中去了么? 有什么坑没??
      • acc828df73b1:大神,拍照识别可以吗?求demo
      • softSnow:数字训练库该如何实现
      • 南宫逸诺:大神你好 你的demo我拷贝进来了但是 她说我Error:(29, 13) Failed to resolve: com.rmtheis:tess-two:6.2.0 为什么 ?
        喵了个呜s:@南宫逸诺 http://jcenter.bintray.com/com/rmtheis/tess-two/ 直接去下载文件吧
        南宫逸诺:@喵了个呜s 嗯嗯 我也看了 也改了 还是没有用 仍然还是失败
        喵了个呜s:看GitHub中他已经更新到8.0 了 试试
        dependencies {
        compile 'com.rmtheis:tess-two:8.0.0'
        }
      • 39ddb27ff47a:demo没了
        39ddb27ff47a:好吧,没看到开头的GitHub
        喵了个呜s:那只能去GitHub里看了
      • 豆奶不好喝:Could not initialize Tesseract API with language=eng! 这是啥意思啊
        喵了个呜s:tessdata文件夹里有eng.traineddata吗
      • 若无初见:camera2 拍照后 得到bitmap设置进去一直卡主。 文件我也复制进去了
        JarryLeo:@好多桥段好聚好散 https://github.com/jarryleo/ChineseOCR 拍照识别的demo
        acc828df73b1:请问大神有没有拍照识别的demo?
        喵了个呜s:拍照识别 没试过呀

      本文标题:tess_two Android图片文字识别

      本文链接:https://www.haomeiwen.com/subject/vbwjnttx.html