美文网首页
JavascriptOCR引擎——Tesseract.js

JavascriptOCR引擎——Tesseract.js

作者: web前端技术 | 来源:发表于2020-05-11 19:47 被阅读0次

介绍

Tesseract.js是流行的面向纯Javascript的OCR引擎的。该库支持100多种语言(中文支持),自动文本方向和脚本检测,用于读取段落,单词和字符边界框的简单界面。Tesseract.js可以在浏览器和具有NodeJS服务器上运行。

Github

https://github.com/naptha/tesseract.js

# For v2版本

npm install tesseract.js

# For v1版本

npm install tesseract.js@1

import Tesseract from 'tesseract.js';

Tesseract.recognize(

        'eng_bw.png',

        'eng', {

          logger: m => console.log(m)

      }

).then(({ data: { text } }) => {

  console.log(text);

});

使用场景

你可以用在你想使用的地方,官方提供了10种使用方式,分别是

Offline Version:

https://github.com/jeromewu/tesseract.js-offline

Electron Version:

https://github.com/jeromewu/tesseract.js-electron

Custom Traineddata: (自定义训练数据)

https://github.com/jeromewu/tesseract.js-custom-traineddata

Chrome Extension #1:

https://github.com/jeromewu/tesseract.js-chrome-extension

Chrome Extension #2:

https://github.com/fxnoob/image-to-text

With Vue:

https://github.com/jeromewu/tesseract.js-vue-app

With Angular:

https://github.com/jeromewu/tesseract.js-angular-app

With React:

https://github.com/jeromewu/tesseract.js-react-app

Typescript:

https://github.com/jeromewu/tesseract.js-typescript

Video Real-time Recognition:

https://github.com/jeromewu/tesseract.js-video

相关文章

网友评论

      本文标题:JavascriptOCR引擎——Tesseract.js

      本文链接:https://www.haomeiwen.com/subject/lcypnhtx.html