介绍
Tesseract.js是流行的面向纯Javascript的OCR引擎的。该库支持100多种语言(中文支持),自动文本方向和脚本检测,用于读取段落,单词和字符边界框的简单界面。Tesseract.js可以在浏览器和具有NodeJS服务器上运行。
Github
https://github.com/naptha/tesseract.js
# For v2版本
npm install tesseract.js
# For v1版本
npm install tesseract.js@1
import Tesseract from 'tesseract.js';
Tesseract.recognize(
'eng_bw.png',
'eng', {
logger: m => console.log(m)
}
).then(({ data: { text } }) => {
console.log(text);
});
使用场景
你可以用在你想使用的地方,官方提供了10种使用方式,分别是
Offline Version:
https://github.com/jeromewu/tesseract.js-offline
Electron Version:
https://github.com/jeromewu/tesseract.js-electron
Custom Traineddata: (自定义训练数据)
https://github.com/jeromewu/tesseract.js-custom-traineddata
Chrome Extension #1:
https://github.com/jeromewu/tesseract.js-chrome-extension
Chrome Extension #2:
https://github.com/fxnoob/image-to-text
With Vue:
https://github.com/jeromewu/tesseract.js-vue-app
With Angular:
https://github.com/jeromewu/tesseract.js-angular-app
With React:
https://github.com/jeromewu/tesseract.js-react-app
Typescript:
https://github.com/jeromewu/tesseract.js-typescript
Video Real-time Recognition:
网友评论