美文网首页tensorflow
Tensorflow训练自己的图像样本与标签

Tensorflow训练自己的图像样本与标签

作者: 鲜人掌 | 来源:发表于2019-01-18 11:02 被阅读723次

    环境配置:

    ubuntu:Ubuntu 16.04.5 LTS x86_64

    tensorflow:1.5.0

    cv2:3.4.4

    基于tensorflow利用卷积神经网络训练自己的图像样本数据具体步骤如下:

    1.获取样本文件

    2.产生用于训练的批次

    3.定义训练的模型(包括初始化参数,卷积、池化层等参数、网络)

    4.训练

    5.验证


    1.读取图片文件

    图1是我的部分图片样本数据的名称。图片来源是通过opencv截取的人脸照片,‘-’前部分为测试人脸名称。大小为(60*60*3)高-宽-颜色通道。由于图片命名与训练标签有关。

    图1 部分样本数据

    获取文件名及对应的标签,由于标签是one-hot类型,根据文件名的“-”前半部分为人的名称。本想通过直接将名称的各个字符相加之和作为标签,但是考虑到如果名称太长,那么和就非常大,不适合使用one-hot作为标签矩阵了。于是改成{文件名前部分:label}的json格式,来实现标签与名称的映射关系,待预测时,根据标签找到对应的名称即可。

    下图功能是获取filename目录下的文件名与文件名对应的标签.(还可以加个判断对应的文件是否已jpg结束)

    图2 获取样本

    将jsonData文件名对应的索引作为标签,即类别(其数据类型要确定,后面要转为tensor类型数据)。image_list为图片文件的绝对路径名称。

    2.产生训练批次

    根据对应的文件名读取内容,将其放在文件队列中。进行批量获取。

    图3 产生训练批次

    首先使用tf.cast转化为tensorflow数据格式,使用tf.train.slice_input_producer实现一个输入的队列。label不需要处理,image存储的是路径,需要读取为图片,接下来的几步就是读取路径转为图片,用于训练。

    CNN对图像大小是敏感的,Line147/148 图片resize处理为大小一致,Line149将其标准化,即减去所有图片的均值,方便训练。

    接下来使用tf.train.batch函数产生训练的批次。最后将产生的批次做数据类型的转换和shape的处理即可产生用于训练的批次。

    有一点比较迷惑:

    Line144的label和Line149的image实际上只是一个图片的标签和对应的图片矩阵,为什么在Line151能够从一组数据中能够得到batch_size(大于1)个样本数据与标签呢????????希望高人指点一下

    3.定义训练模型

     a.定义权重和偏置

            定义最大是64个分类,对应的就是64个人脸名称。

    图4 定义权重与偏置

    b.定义训练层及训练模型

    采用三层神经网络进行构建训练模型。即三种层神经网络,即卷积层Line178、池化层Line183和正则化层Line186

    图5 训练模型

    Line189---Line 200后面的注释标识对应计算之后的矩阵大小。

    c.定义损失、评估及训练方式

    图6 定义损失与评估及训练方式

    4.开始训练

    采用协调器开启多线程,加速实现对图片文件的加载读取与训练。具体方法可以网上搜索一下。同时将训练后的模型保存下来。防止程序挂了之后需要重新训练。测试训练数据较少,201次循环及每次取10个样本,就可以达到理想的预测效果。

    图6 开始训练

    5.验证效果

    a.训练后直接验证效果

    将predict1()函数直接放在 步骤4中“开始训练” 的coord.join(threads) 的后面即可。

    图7 训练后直接验证

    打印的结果即是jsonData中对应的value值,根据value值找到对应的key即可。

    b.通过加载训练模板进行验证

    图8 加载训练模型进行验证

    到此为止,整个过程结束。

    欢迎与大家共同讨论研究。

    相关文章

      网友评论

        本文标题:Tensorflow训练自己的图像样本与标签

        本文链接:https://www.haomeiwen.com/subject/rcmgdqtx.html