美文网首页开发组件
组件分享之后端组件——一个基于Golang的ORC组件包

组件分享之后端组件——一个基于Golang的ORC组件包

作者: cn華少 | 来源:发表于2022-03-28 20:24 被阅读0次

    组件分享之后端组件——一个基于Golang的ORC组件包

    背景

    近期正在探索前端、后端、系统端各类常用组件与工具,对其一些常见的组件进行再次整理一下,形成标准化组件专题,后续该专题将包含各类语言中的一些常用组件。欢迎大家进行持续关注。

    组件基本信息

    内容

    本节我们分享一个基于Golang的ORC组件包gosseract,当下对于图片识别的需求越来越多,难免我们需要在Go程序下进行图片的处理,本节我们就进行分享一个ORC的工具包gosseract,它是通过使用Tesseract c++库进行实现的,如果你想按照服务的方式使用,直接部署https://github.com/otiai10/ocrserver即可,支持docker部署,如果是在代码中使用就需要看下面的案例了。

    package main
    
    import (
        "fmt"
        "github.com/otiai10/gosseract/v2"
    )
    
    func main() {
        client := gosseract.NewClient()
        defer client.Close()
        client.SetImage("path/to/image.png")
        text, _ := client.Text()
        fmt.Println(text)
        // Hello, World!
    }
    

    代码中使用也比较简单,加载起来相关需要识别的图片就可以有效读取器内容信息,当然我们也可以在docconv组件中一起使用本次的OCR组件,详细可以参考Issues,这里面详细的说明了。

    注:上述代码在运行时需要确保你当前环境下已经安装了tesseract-ocr,这里我们建议使用Ubuntu环境或容器环境下使用,具体tesseract-ocr安装可以参考Dockerfile,还是比较简单的,基本使用apt命令就可以快速安装好了。

    本文声明:
    88x31.png
    知识共享许可协议
    本作品由 cn華少 采用 知识共享署名-非商业性使用 4.0 国际许可协议 进行许可。

    相关文章

      网友评论

        本文标题:组件分享之后端组件——一个基于Golang的ORC组件包

        本文链接:https://www.haomeiwen.com/subject/sgipjrtx.html