美文网首页tensorflow
Tensorflow训练自己的图像样本与标签

Tensorflow训练自己的图像样本与标签

作者: 鲜人掌 | 来源:发表于2019-01-18 11:02 被阅读723次

环境配置:

ubuntu:Ubuntu 16.04.5 LTS x86_64

tensorflow:1.5.0

cv2:3.4.4

基于tensorflow利用卷积神经网络训练自己的图像样本数据具体步骤如下:

1.获取样本文件

2.产生用于训练的批次

3.定义训练的模型(包括初始化参数,卷积、池化层等参数、网络)

4.训练

5.验证


1.读取图片文件

图1是我的部分图片样本数据的名称。图片来源是通过opencv截取的人脸照片,‘-’前部分为测试人脸名称。大小为(60*60*3)高-宽-颜色通道。由于图片命名与训练标签有关。

图1 部分样本数据

获取文件名及对应的标签,由于标签是one-hot类型,根据文件名的“-”前半部分为人的名称。本想通过直接将名称的各个字符相加之和作为标签,但是考虑到如果名称太长,那么和就非常大,不适合使用one-hot作为标签矩阵了。于是改成{文件名前部分:label}的json格式,来实现标签与名称的映射关系,待预测时,根据标签找到对应的名称即可。

下图功能是获取filename目录下的文件名与文件名对应的标签.(还可以加个判断对应的文件是否已jpg结束)

图2 获取样本

将jsonData文件名对应的索引作为标签,即类别(其数据类型要确定,后面要转为tensor类型数据)。image_list为图片文件的绝对路径名称。

2.产生训练批次

根据对应的文件名读取内容,将其放在文件队列中。进行批量获取。

图3 产生训练批次

首先使用tf.cast转化为tensorflow数据格式,使用tf.train.slice_input_producer实现一个输入的队列。label不需要处理,image存储的是路径,需要读取为图片,接下来的几步就是读取路径转为图片,用于训练。

CNN对图像大小是敏感的,Line147/148 图片resize处理为大小一致,Line149将其标准化,即减去所有图片的均值,方便训练。

接下来使用tf.train.batch函数产生训练的批次。最后将产生的批次做数据类型的转换和shape的处理即可产生用于训练的批次。

有一点比较迷惑:

Line144的label和Line149的image实际上只是一个图片的标签和对应的图片矩阵,为什么在Line151能够从一组数据中能够得到batch_size(大于1)个样本数据与标签呢????????希望高人指点一下

3.定义训练模型

 a.定义权重和偏置

        定义最大是64个分类,对应的就是64个人脸名称。

图4 定义权重与偏置

b.定义训练层及训练模型

采用三层神经网络进行构建训练模型。即三种层神经网络,即卷积层Line178、池化层Line183和正则化层Line186

图5 训练模型

Line189---Line 200后面的注释标识对应计算之后的矩阵大小。

c.定义损失、评估及训练方式

图6 定义损失与评估及训练方式

4.开始训练

采用协调器开启多线程,加速实现对图片文件的加载读取与训练。具体方法可以网上搜索一下。同时将训练后的模型保存下来。防止程序挂了之后需要重新训练。测试训练数据较少,201次循环及每次取10个样本,就可以达到理想的预测效果。

图6 开始训练

5.验证效果

a.训练后直接验证效果

将predict1()函数直接放在 步骤4中“开始训练” 的coord.join(threads) 的后面即可。

图7 训练后直接验证

打印的结果即是jsonData中对应的value值,根据value值找到对应的key即可。

b.通过加载训练模板进行验证

图8 加载训练模型进行验证

到此为止,整个过程结束。

欢迎与大家共同讨论研究。

相关文章

  • Tensorflow训练自己的图像样本与标签

    环境配置: ubuntu:Ubuntu 16.04.5 LTS x86_64 tensorflow:1.5.0 c...

  • tensorflow训练自己的数据集实现CNN图像分类1

    tensorflow训练自己的数据集实现CNN图像分类1

  • DL01-5:感知器实现(Tensorflow版本)

    本主题内容:使用Tensorflow框架实现一个感知;使用感知器训练鸢尾花样本,并使用训练样本作为测试样本;使用T...

  • k-近邻算法

    原理 训练样本集中,每个数据都有标签(相应的分类) 将新数据的每个特征与样本集数据对应特征比较 选择样本集中与新数...

  • k-近邻算法

    KNN 原理 假设有一个带有标签的样本数据集(训练样本集),其中包含每条数据与所属分类的对应关系。 输入没有标签的...

  • R成精-机器学习分类算法

    1、算法介绍 一个样本对应一个分类,用训练数据训练一个分类器,在输入没有标签的样本时,将新数据与训练集的数据对应特...

  • 训练数据集与TFRecord互相转换的两种方式

    TensorFlow使用TFRecord格式来统一存储数据,该格式可以将图像数据、标签信息、图像路径以及宽高等不同...

  • java 调用tensorflow

    1.java读取tensorflow中图像的分类模型 2.tensorflow训练好的模型中java调用 3.『T...

  • KNN算法——1

    原理 存在一个样本数据集合,也称作为训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一个数据与所属...

  • 目标检测:R-CNN问题总结

    一、R-CNN的处理思想 采用CNN网络提取图像特征; 采用大样本下有监督预训练+小样本微调的方式解决小样本难以训...

网友评论

    本文标题:Tensorflow训练自己的图像样本与标签

    本文链接:https://www.haomeiwen.com/subject/rcmgdqtx.html