机器学习100天-Day2504 Tensorboard 数据可

作者: 我的昵称违规了 | 来源:发表于2019-02-12 09:18 被阅读1次
    首页.jpg
    今日重点
    阅读一篇关于RNN网络可视化的代码,作者写的比较清晰易懂,可以用来借鉴。我找了好久,在博客园找到的这篇,强烈推荐博客园(https://www.cnblogs.com/cloud-ken/p/9327746.html)。

    Tensorboard是一个神经网络可视化工具,通过使用本地服务器在浏览器上查看神经网络训练日志,生成相应的可是画图,帮助炼丹师优化神经网络。
    油管上有单迪伦·马内在2017年做的汇报,很惊艳。主要包括了以下主要功能

    • 可视化网络
    • 可视化训练过程
    • 多模型效果可视化对比

    0. 引入必要库

    tqdm库用来显示运行进度条。

    import tensorflow as tf
    from tensorflow.examples.tutorials.mnist import input_data
    import tqdm
    

    1. 生成变量监控信息并定义生成监控信息日志的操作。

    var给出了需要记录的张量,name给出了在可视化结果中显示的图表名称,这个名称一般和变量名一致。使用name_scope将生成监控信息的操作放在同一个命名空间下。
    这个操作值得借鉴,我看tensorboard的指引代码的时候感觉很难理解,应该是我阅读能力的问题。

    通过tf.histogram_summary函数记录张量中元素的取值分布
    tf.summary.histogram函数会生成一个Summary protocol buffer。将Summary 写入TensorBoard 日志文件后,在HISTOGRAMS 栏,和DISTRIBUTION 栏下都会出现对应名称的图表。和TensorFlow 中其他操作类似,
    tf.summary.histogram 函数不会立刻被执行,只有当sess.run 函数明确调用这个操作时, TensorFlow才会具正生成并输出Summary protocol buffer。

    SUMMARY_DIR = "./logs/rnn4"
    BATCH_SIZE = 100
    TRAIN_STEPS = 3000
    
    # var给出了需要记录的张量,name给出了在可视化结果中显示的图表名称,这个名称一般和变量名一致
    def variable_summaries(var, name):
        # 将生成监控信息的操作放在同一个命名空间下
        with tf.name_scope('summaries'):
            tf.summary.histogram(name, var)
            
            # 计算变量的平均值,并定义生成平均值信息日志的操作,记录变量平均值信息的日志标签名为'mean/'+name,其中mean为命名空间,/是命名空间的分隔符在相同命名空间中的监控指标会被整合到同一栏中,name则给出了当前监控指标属于哪一个变量
            mean = tf.reduce_mean(var)
            tf.summary.scalar('mean/' + name, mean)
    
            # 计算变量的标准差,并定义生成其日志文件的操作
            stddev = tf.sqrt(tf.reduce_mean(tf.square(var - mean)))
            tf.summary.scalar('stddev/' + name, stddev)
    

    2. 生成一层全链接的神经网络。

    在这个神经网络层中,定义了权重weights,偏置biases,算法Wx_plus_b,其实也是一个很简单的神经网络。

    def nn_layer(input_tensor, input_dim, output_dim, layer_name, act=tf.nn.relu):
        # 将同一层神经网络放在一个统一的命名空间下
        with tf.name_scope(layer_name):
            # 声明神经网络边上的权值,并调用权重监控信息日志的函数
            with tf.name_scope('weights'):
                weights = tf.Variable(tf.truncated_normal([input_dim, output_dim], stddev=0.1))
                variable_summaries(weights, layer_name + '/weights')
    
            # 声明神经网络边上的偏置,并调用偏置监控信息日志的函数
            with tf.name_scope('biases'):
                biases = tf.Variable(tf.constant(0.0, shape=[output_dim]))
                variable_summaries(biases, layer_name + '/biases')
            with tf.name_scope('Wx_plus_b'):
                preactivate = tf.matmul(input_tensor, weights) + biases
                # 记录神经网络节点输出在经过激活函数之前的分布
                tf.summary.histogram(layer_name + '/pre_activations', preactivate)
            activations = act(preactivate, name='activation')
    
            # 记录神经网络节点输出在经过激活函数之后的分布。
    

    对于layer1 ,因为使用了ReLU函数作为激活函数,所以所有小于0的值部被设为了0。于是在激活后的layer1 / activations图上所有的值都是大于0的。
    对于layer2 ,因为没有使用激活函数,所以layer2 / activations和layer2 / pre_activations一样。

    tf.summary.histogram(layer_name + '/activations', activations)
    return activations
    

    3.设定主函数

    主函数里面包括数据、网络设置、反向传播、正确率计算等。

    def main():
        mnist = input_data.read_data_sets(".\MNIST_data/", one_hot=True)
        
        with tf.name_scope('input'):
            x = tf.placeholder(tf.float32, [None, 784], name='x-input')
            y_ = tf.placeholder(tf.float32, [None, 10], name='y-input')
        
        with tf.name_scope('input_reshape'):
            image_shaped_input = tf.reshape(x, [-1, 28, 28, 1])
            tf.summary.image('input', image_shaped_input, 10)
        # 将输入变量还原成图片的像素矩阵,并通过tf.iamge_summary函数定义将当前的图片信息写入日志的操作
        
        hidden1 = nn_layer(x, 784, 500, 'layer1')
        y = nn_layer(hidden1, 500, 10, 'layer2', act=tf.identity)
        
        # 计算交叉熵并定义生成交叉熵监控日志的操作。
        with tf.name_scope('cross_entropy'):
            cross_entropy = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=y, labels=y_))
            tf.summary.scalar('cross_entropy', cross_entropy)
        
        with tf.name_scope('train'):
            train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy)
    
        with tf.name_scope('accuracy'):
            with tf.name_scope('correct_prediction'):
                correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1))
            with tf.name_scope('accuracy'):
                accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))
            tf.summary.scalar('accuracy', accuracy)
        
        # tf.scalar_summary,tf.histogram_summary,tf.image_summary函数都不会立即执行,需要通过sess.run来调用这些函数,因为程序重定义的写日志的操作非常多,一一调用非常麻烦,所以Tensorflow提供了tf.summary.merged_all()函数来整理所有的日志生成操作。在Tensorflow程序执行的过程中只需要运行这个操作就可以将代码中定义的所有日志生成操作全部执行一次,从而将所有日志文件写入文件。
        merged = tf.summary.merge_all()
    
        with tf.Session() as sess:
            # 初始化写日志的writer,并将当前的Tensorflow计算图写入日志
            summary_writer = tf.summary.FileWriter(SUMMARY_DIR, sess.graph)
            tf.global_variables_initializer().run()
        
            for i in tqdm.tqdm(range(TRAIN_STEPS)):
                xs, ys = mnist.train.next_batch(BATCH_SIZE)
                # 运行训练步骤以及所有的日志生成操作,得到这次运行的日志。
                summary, _ = sess.run([merged, train_step], feed_dict={x: xs, y_: ys})
                # 将得到的所有日志写入日志文件,这样TensorBoard程序就可以拿到这次运行所对应的
                # 运行信息。
                summary_writer.add_summary(summary, i)
        
        summary_writer.close()
    
    
    if __name__ =='__main__':
        main()
    

    运行后可以在操作界面查看运行的情况。效果其实不错。


    tensorboard01.png tensorboard02.png tensorboard03.png tensorboard04.png tensorboard05.png

    相关文章

      网友评论

        本文标题:机器学习100天-Day2504 Tensorboard 数据可

        本文链接:https://www.haomeiwen.com/subject/hkdheqtx.html