美文网首页机器学习杂文
基于keras 实现的验证码ocr识别

基于keras 实现的验证码ocr识别

作者: yangy_fly | 来源:发表于2020-02-28 14:32 被阅读0次

自从app2vec工作告一段落后,在公司招聘面试过程中发现了一个有意思的东西OCR(Optical Character Recognition)。于是趁目前疫情期间有一些时间的情况下,做了一些浅显的简单尝试。

数据准备

数据使用captcha生成。生成一些带有高斯噪音的验证码图片,图片固定大小为160*60。生成的验证码展示如下:


image.png

网络构建

网络使用常见的结构,即多层CNN+MaxPooling+RNN网络。目前更主流的做法,尤其是需要针对不定长字符检测的情况,会在RNN后加上CTC,以便更好识别不定长字符串,这也是后期我需要加入的新工作。

model.png

效果展示

训练了6个epoch,每个epoch训练样本512200,验证集样本51250。验证集准确率平均约为94%,测试集上的准确率为89.2%。对于"D0OP"以及"O00O"这种变态的验证码偶尔也能识别出来。

image.png

后期优化点

  • 加入CTC,识别不定长字符串
  • 增加读取本地文件功能
  • 增加对不同size的图片的识别功能

相关文章

网友评论

    本文标题:基于keras 实现的验证码ocr识别

    本文链接:https://www.haomeiwen.com/subject/xuclhhtx.html