Tensorflow的一些笔记

作者: 飞多多 | 来源:发表于2019-09-28 21:06 被阅读0次

install tensorflow on Ubuntu 16.
TensorFlow学习笔记：Inception_v3源码分析
Tensorflow学习笔记（二）
tensorflow学习笔记系列（三）：tensorflow入门
tensorflow学习笔记系列（二）：tensorflow简介
Tensorflow的一些笔记
TensorFlow 环境搭建
【转】Tensorflow 实现 MNIST 手写数字识别
Tensorflow 构建简单神经网络
tensorflow 进阶学习

tensorflow中的图及其持久化和加载

在我们创建tensorflow工作的时候，tf就默认生成了一个图，这就是我们的默认图。通过tf.get_default_graph() 可以得到。graphdef是图的描述，说白了就是图的各种信息的集合。

图的持久化

图的固化常见的有两种，一种是.ckpt格式的，这种持久化充分的保留了信息，可以通过加载.ckpt格式的文件，完全恢复一张图，并在其上继续训练。因为tf的训练过程是一个漫长的过程，如果中间出错，这种方式可以保证我们从上次出错前的地方恢复，继续训练，而不用完全从头开始。

另一种方式就是.pb格式的固化，这是把.ckpt格式文件中的参数freeze下来后的一种固化。这种格式的文件应该是不能再训练的。只能用作推导来使用。这也是我们对于一张已经训练好的图，为了部署应用它，我们经常使用的格式。它的基本固化代码如下：

# coding=UTF-8
import tensorflow as tf
from tensorflow.python.framework import graph_util

#定义一张图
inputs = tf.placeholder(tf.float32,[],name='input_node')
a = tf.Variable(3.0)
b = tf.Variable(7.0)
sums = tf.add(inputs, a, name="sum_op")
result = tf.multiply(sums,b, name='output_node')
output_graph = "./pb/easy_pb.pb"#输出路径

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    #将图freeze，即将各种变量转变为常量
    output_graph_def = graph_util.convert_variables_to_constants(  #模型持久化，将变量值固定
        sess,
        sess.graph_def,
        ["output_node"] #与之前的输出节点相对应，如果有多个输出点，使用列表表明
        )
    with open(output_graph, "wb") as f: #保存模型
        f.write(output_graph_def.SerializeToString()) #序列化输出
    print sess.run(result,feed_dict={inputs:2})

图的加载

得到,pb的固化网络之后，我们通过对它的加载，然后找到它的输入和输出节点，我们就可以做推导了。譬如我们加载inception模型并推导其最后的输出：

# coding=UTF-8
import tensorflow as tf

input_graph_path = "./pb/classify_image_graph_def.pb"
pic = tf.gfile.FastGFile("./flower.jpg",'rb').read()

with open(input_graph_path , 'rb') as f:
    output_graph_def = tf.GraphDef() #定义一个图描述，用于接受参数
    output_graph_def.ParseFromString(f.read()) #从.pb中读取并解析参数
    tf.import_graph_def(output_graph_def,name='')#将之前定义的图描述导入到默认的图中
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    ipt = sess.graph.get_tensor_by_name("DecodeJpeg/contents:0")
    opt = sess.graph.get_tensor_by_name("pool_3/_reshape:0")
    squeezed = tf.squeeze(opt)
    #for i in range(10):
    bottleneck =  sess.run(squeezed ,feed_dict={ipt:pic})
    print bottleneck.shape

operation和tensor

我之前对这个东西一直是模棱两可的。按字面来说，operation就是操作，tensor就是张量。张量是需要零个或多个张量的流入，具备零个或多个张量的流出。在整个计算图中，图上的节点即为计算，图上的边就是张量。比如在

a = tf.constant([1,2],[2,3])
b = tf.constant([3,4],[4,5])
c = tf.matmul(a,b)
d = tf.Variable(1.0)
f = tf.placeholder(dtype=tf.float32,[2,3])
e = tf.train.GradientDescentOptimizer(0.01).minimize(d)

我们可以看到，a,b,c,d,f是张量。d是变量,f是placeholder，他们都是特殊的张量。e是操作节点。但是应该说明的是，abc虽然是张量，但是他们都隐晦的创建了操作节点。譬如c就创建了MatMul的节点，c实际上是该节点的输出张量，a和b是该节点的输入张量，所以c的默认张量名称是“MatMul：0”，这表明c是该节点的第一个输出张量。形象的说明就是，张量是液体，操作节点就是水管的节点连接和处理的方式，变量就是状态液体，即可以任意变化，placeholder就是虚拟液体，整个管网系统就是图了。和差积商指数对数赋值等等都是方式，他们都是op，这种op会有输出，输出新的tensor。像上面的e这种op就没有输出，他是调整整个“水管系统”（即图）中的配方（状态液体）的一种操作。

dense函数

在构造神经网络的过程中，我们通常是定义权重和便宜变量，然后通过张量的乘法和加法来构造，然后再引入激活函数。但是这样略显麻烦，如果没有特殊的要求，我们可以使用tf.layers.dense()来直接构建全连接层。

变量复用

我们通过变量的命名空间来限定变量，防止命名冲突引起的错误。tf.variable_scope()来实现命名空间，我们就可以通过tf.get_variable()来获得变量。这个函数中的reuse参数设置为True的时候，如果变量变成已经存在，我们就会立即获得已经存在的变量，即变量的重复使用。这对在训练过程中的模型，我们可以实现即时推导。另外要说的是，在tf中，有tf.Variable()和tf.get_variable()等函数可以创建变量tensor，从变量复用的角度来讲，我更推荐后者。举例说明：

import tensorflow as tf

def get_v(reuse = False):
    with tf.variable_scope("v", reuse=reuse):
        a = tf.get_variable("v1",shape=[2,3], initializer=tf.ones_initializer() )
    a = tf.assign_add(a,a)
    return a   
if __name__ == '__main__':
    a =get_v()
    with tf.Session() as sess:
        sess.run(tf.global_variables_initializer())
        for i in range(2):
            print sess.run(a) 
        p =get_v(True) 
        for i in range(2):
            print sess.run(p)

这段代码定义了一个获得变量a以及一个自加的操作的函数，然后我们创建之。然后我们通过自加操作，使a自加两次，变成4，然后我们通过设置reuse=True，我们再次调用该函数，我们就能立即获得已经创建的a，而不会再次从ones_initializer()去创建，我们获得a是4，在进行两次自加操作，我们就能得到16。所以，我们构建inference的时候，我们就可以用这种方式，即时推导的时候方便，主要是防止在推导过程中不小心创建新变量。

Tensorlfow on Andriod

我们训练好的图模型，通过固化成.pb的格式，我们可以讲其部署在android等移动设备端。

如果对android编程有了解，那么在android端的部署比较简单。无非是使用.so共享库和.jar，他们可以通过bazel编译tensorflow工程中的源码获得，也可以在这里下载已经编译好的。关于向工程中添加共享库的方式，网上有很多介绍。这里我要提醒自己一点，在使用共享库的时候，应该先用

 static {
        System.loadLibrary("tensorflow_inference");
    }

加载，这是我之前没注意到的。

使用方式也很简单

// Load the model from disk.
TensorFlowInferenceInterface inferenceInterface =
new TensorFlowInferenceInterface(assetManager, modelFilename);

// Copy the input data into TensorFlow.
inferenceInterface.feed(inputName, floatValues, 1, inputSize, inputSize, 3);

// Run the inference call.
inferenceInterface.run(outputNames, logStats);
// Copy the output Tensor back into the output array.
inferenceInterface.fetch(outputName, outputs);

本来很简单的一个事情，我测试自己训练的最简单的.pb文件也没问题，然后就上inceptionv5的模型，下载下来后，发现运行时总是报没有OpKerne节点的错误。后来参考github上的一些回答，才明白原本的代码中的一些节点不被轻量级的tensorflow支持。我们需要剥出它们。后来我就下载了一个优化后的.pb，然后就能很好的work了。

这里是我的工程代码，虽然简陋，但部署过程中的基本环节都涉及到了。

Import Data

关于tf的数据输入，官网教程有很丰富的说明和举例，但是我这里要说明的一点点小事情:

官网教程中Decoding image data and resizing it小节中的示例代码中的

image_decoded = tf.image.decode_image(image_string)

似乎不太好使，不能够正确的解析图片。如果图片格式都是Jpg格式的，我使用

tf.image.decode_jpeg（）

或者相应的格式的函数可以成功的解析图片。

另外，图片的输入处理过程比较好的流程是是：map->shuffle->batch->repeat

install tensorflow on Ubuntu 16.
Reference Installing TensorFlow on Ubuntu TensorFlow学习笔记（...
TensorFlow学习笔记：Inception_v3源码分析
TensorFlow学习笔记：Retrain Inception_v3（一） TensorFlow学习笔记：Ret...
Tensorflow学习笔记（二）
在Tensorflow学习笔记（一）中，我们介绍了tensorflow的主要思想，本节将介绍tensorflow关...
Tensorflow的一些笔记
tensorflow中的图及其持久化和加载在我们创建tensorflow工作的时候，tf就默认生成了一个图，这就...
TensorFlow 环境搭建
Mac 基于Anaconda的TensorFlow安装笔记] 参考资料:https://tensorflow.go...
【转】Tensorflow 实现 MNIST 手写数字识别
原文 Tensorflow 实现 MNIST 手写数字识别本节笔记作为 Tensorflow 的 Hello W...
Tensorflow 构建简单神经网络
Tensorflow 构建简单神经网络莫凡Tensorflow教程笔记https://morvanzhou.gi...
tensorflow 进阶学习
TensorFlow-Examples tensorflow学习笔记三：实例数据下载与读取 Convolution...