美文网首页
18. 应用例子图片识别文本(Photo OCR)

18. 应用例子图片识别文本(Photo OCR)

作者: justinwei | 来源:发表于2019-03-31 09:39 被阅读0次

    第十一周 Lecture 18

    1. 问题描述:从一张照片识别出文本 Photo OCR(Optical Character Recognization)
      流水线(Pipeline)


      image.png
    • 文本检测,使用滑动窗口(sliding window)
      设计一个w * h 大小的矩形,判断是否有文本(可以使用逻辑回归或神经网络的方法判断),每次向右移动w1象素,再判断,移到最右边后,再向下移动h1象素,循环判断。如下图例所示:


      image.png
      image.png
    • 字母分割
      滑动窗口,找到两个字母交界处(使用使用逻辑回归或神经网络的方法判断)
      然后中间分割一下。


      image.png
    • 字母识别
      使用使用逻辑回归或神经网络的方法即可
    1. 获得大量数据和人工数据(get lots of data/Artificial data synthesis)
    • 人工生成训练数据
      例如:字母识别,可以使用不同的字体重新生成数据


      image.png

      再如:对于语音识别,人为制造噪音(noisy)

    • 获得更多训练数据的要点
      1. 增加训练数据前,要确保算法已经是“低偏差” low bias
      2. 如果获得更多数据
        用代码人工生成(Artificial data synthesis)
        人工标记 Collect / Label it your self ,使用“众包”(crowd source)
    1. 天花板分析(ceiling analysis)
      决定对哪个模块付出更多投入,或是哪些投入最有效
      方法是:假设某一步的准确率为100%时,总结准确率会变成多少。如果将某一步的准确率设为100%后,总体的准确率有较大的提高,说明这一步投入的精力/努力是有价值的。

    相关文章

      网友评论

          本文标题:18. 应用例子图片识别文本(Photo OCR)

          本文链接:https://www.haomeiwen.com/subject/xtkybqtx.html