Tensorflow搭建CNN实现验证码识别

作者: AwesomeTang | 来源:发表于2019-01-14 22:13 被阅读93次

Tensorflow搭建CNN实现验证码识别
SkySeraph AI 实践到理论系列
keras入门（三）搭建CNN模型破解网站验证码
搭建CNN模型破解网站验证码！Python大法真的好！
TensorFlow之验证码的生成和检测
Ocr手写识别学习
基于tensorflow搭建一个复杂卷积神经网络模型（cifar
opencv，tensorflow，cnn实现人脸识别
tensorflow和numpy验证码识别
基于TensorFlow Slim库实现手写数字识别

整个项目代码分为三部分：

Generrate_Captcha:
- 生成验证码图片（训练集，验证集和测试集）；
- 读取图片数据和标签（标签即为图片文件名）；
cnn_model:卷积神经网络；
driver:模型训练及评估。

Generate Captcha

配置项

class Config(object):
    width = 160  # 验证码图片的宽
    height = 60  # 验证码图片的高
    char_num = 4  # 验证码字符个数
    characters = range(10)  # 数字[0,9]
    test_folder = 'test'    # 测试集文件夹，下同
    train_folder = 'train'
    validation_folder = 'validation'
    tensorboard_folder = 'tensorboard'  # tensorboard的log路径
    generate_num = (5000, 500, 500)  # 训练集，验证集和测试集数量
    alpha = 1e-3  # 学习率
    Epoch = 100  # 训练轮次
    batch_size = 64     # 批次数量
    keep_prob = 0.5     # dropout比例
    print_per_batch = 20    # 每多少次输出结果
    save_per_batch = 20     # 每多少次写入tensorboard

生成验证码（`class Generate`）

验证码图片示例：

0478

check_path():检查文件夹是否存在，如不存在则创建。
gen_captcha():生成验证码方法，写入之前检查是否以存在，如存在重新生成。

读取数据（`classs ReadData`）

read_data():返回图片数组（numpy.array格式）和标签（即文件名）；

label2vec():将文件名转为向量；

例：

label = '1327'

label_vec = [0,1,0,0,0,0,0,0,0,0,
            0,0,0,1,0,0,0,0,0,0,
            0,0,1,0,0,0,0,0,0,0,
            0,0,0,0,0,0,0,1,0,0]

load_data():加载文件夹下所有图片，返回图片数组，标签和图片数量。

定义模型（`cnn_model`）

采用三层卷积，filter_size均为5，为避免过拟合，每层卷积后面均接dropout操作，最终将 $160*60$ 的图像转为 $20*8$ 的矩阵。

大致结构如下：

模型结构

训练&评估

next_batch()：迭代器，分批次返还数据；
feed_data()：给模型“喂”数据；
- x：图像数组；
- y：图像标签；
- keep_prob：dropout比例；
evaluate()：模型评估，用于验证集和测试集。
run_model()：训练&评估

目前效果

目前经过4000次迭代训练集准确率可达99%以上，测试集准确率93%，还是存在一点过拟合，不过现在模型是基于CPU训练的，完成一次训练耗费时间大约4个小时左右，后续调整了再进行更新。

Images for train ：10000, for validation : 1000, for test : 1000
Epoch : 1
Step     0, train_acc:   7.42%, train_loss:  1.43, val_acc:   9.85%, val_loss:  1.40, improved:*  
Step    20, train_acc:  12.50%, train_loss:  0.46, val_acc:  10.35%, val_loss:  0.46, improved:*  
Step    40, train_acc:   9.38%, train_loss:  0.37, val_acc:  10.10%, val_loss:  0.37, improved:   
Step    60, train_acc:   7.42%, train_loss:  0.34, val_acc:  10.25%, val_loss:  0.34, improved:   
Step    80, train_acc:   7.81%, train_loss:  0.33, val_acc:   9.82%, val_loss:  0.33, improved:   
Step   100, train_acc:  12.11%, train_loss:  0.33, val_acc:  10.00%, val_loss:  0.33, improved:   
Step   120, train_acc:   9.77%, train_loss:  0.33, val_acc:  10.07%, val_loss:  0.33, improved:   
Step   140, train_acc:   8.98%, train_loss:  0.33, val_acc:  10.40%, val_loss:  0.33, improved:*  
Epoch : 2
Step   160, train_acc:   8.20%, train_loss:  0.33, val_acc:  10.52%, val_loss:  0.33, improved:*  
...
Epoch : 51
Step  7860, train_acc: 100.00%, train_loss:  0.01, val_acc:  92.37%, val_loss:  0.08, improved:   
Step  7880, train_acc:  99.61%, train_loss:  0.01, val_acc:  92.28%, val_loss:  0.08, improved:   
Step  7900, train_acc: 100.00%, train_loss:  0.01, val_acc:  92.42%, val_loss:  0.08, improved:   
Step  7920, train_acc: 100.00%, train_loss:  0.00, val_acc:  92.83%, val_loss:  0.08, improved:   
Step  7940, train_acc: 100.00%, train_loss:  0.01, val_acc:  92.77%, val_loss:  0.08, improved:   
Step  7960, train_acc: 100.00%, train_loss:  0.01, val_acc:  92.68%, val_loss:  0.08, improved:   
Step  7980, train_acc: 100.00%, train_loss:  0.00, val_acc:  92.63%, val_loss:  0.09, improved:   
No improvement for over 1000 steps, auto-stopping....
Test accuracy:  93.00%, loss:  0.08

Tensorboard
每次训练之前将Tensorboard路径下的文件删除，不然趋势图上会凌乱。
- Accurracy
- loss

Tensorflow搭建CNN实现验证码识别
完整代码：GitHub我的简书：Awesome_Tang的简书整个项目代码分为三部分： Generrate_Ca...
SkySeraph AI 实践到理论系列
TensorFlow基础 Android+TensorFlow+CNN+MNIST 手写数字识别实现
keras入门（三）搭建CNN模型破解网站验证码
项目介绍在文章CNN大战验证码中，我们利用TensorFlow搭建了简单的CNN模型来破解某个网站的验证码。...
搭建CNN模型破解网站验证码！Python大法真的好！
项目介绍在文章CNN大战验证码中，我们利用TensorFlow搭建了简单的CNN模型来破解某个网站的验证码。验证...
TensorFlow之验证码的生成和检测
主要使用Tensorflow深度学习框架和卷积神经网络（CNN）算法实现对验证码识别的功能。步骤 1.captc...
Ocr手写识别学习
Ocr手写识别学习（三）本文将实现基于CNN的手写汉字识别 1.目的本篇文章将使用tensorflow搭建一个...
基于tensorflow搭建一个复杂卷积神经网络模型（cifar
上一篇搭建了一个简单的cnn网络用来识别手写数字。基于tensorflow搭建一个简单的CNN模型(code) ...
opencv，tensorflow，cnn实现人脸识别
opencv实现人脸检测，tensorflow利用cnn实现人脸识别，python完成github地址: http...
tensorflow和numpy验证码识别
使用tensorflow或numpy实现验证码识别，有两个版本，直接用tensorflow实现的很简单，使用num...
基于TensorFlow Slim库实现手写数字识别
本文介绍如何基于Tensorflow的Slim库，利用CNN（卷积神经网络）实现手写数字识别。本文GitHub源...

Tensorflow搭建CNN实现验证码识别

Generate Captcha

配置项

生成验证码（`class Generate`）

读取数据（`classs ReadData`）

定义模型（`cnn_model`）

训练&评估

目前效果

相关文章

Tensorflow搭建CNN实现验证码识别

SkySeraph AI 实践到理论系列

keras入门（三）搭建CNN模型破解网站验证码

搭建CNN模型破解网站验证码！Python大法真的好！

TensorFlow之验证码的生成和检测

Ocr手写识别学习

基于tensorflow搭建一个复杂卷积神经网络模型（cifar

opencv，tensorflow，cnn实现人脸识别

tensorflow和numpy验证码识别

基于TensorFlow Slim库实现手写数字识别

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

TensorFlow技术帖

机器学习

大数据，机器学习，人工智能

深度学习·神经网络·计算机视觉

大数据爬虫Python AI Sql

大数据

机器学习实战

机器学习与数据挖掘

Tensorflow搭建CNN实现验证码识别

Generate Captcha

配置项

生成验证码（class Generate）

读取数据（classs ReadData）

定义模型（cnn_model）

训练&评估

目前效果

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

生成验证码（`class Generate`）

读取数据（`classs ReadData`）

定义模型（`cnn_model`）