美文网首页
[tensorflow] 例子3 建造神经网络

[tensorflow] 例子3 建造神经网络

作者: 反复练习的阿离很笨吧 | 来源:发表于2019-07-28 00:02 被阅读0次

    本文来自例子3 建造神经网络

    代码:tf11_build_network/full_code.py

    在此基础上加上了自己(粘贴)的笔记。

    定义 add_layer()

    在 Tensorflow 里定义一个添加层的函数可以很容易的添加神经层,为之后的添加省下不少时间.

    神经层里常见的参数通常有weights、biases和激励函数。

    首先,我们需要导入tensorflow模块。

    1. 然后定义添加神经层的函数def add_layer(),它有四个参数:输入值、输入的大小、输出的大小和激励函数,我们设定默认的激励函数是None。

    2. 接下来,我们开始定义weights和biases。

      • 因为在生成初始参数时,随机变量(normal distribution)会比全部为0要好很多,所以我们这里的weights为一个in_size行, out_size列的随机变量矩阵。
      • biases的推荐值不为0,所以我们这里是在0向量的基础上又加了0.1。
    3. 下面,我们定义Wx_plus_b, 即神经网络未激活的值。其中,tf.matmul()是矩阵的乘法。

    4. 当activation_function——激励函数为None时,输出就是当前的预测值——Wx_plus_b,不为None时,就把Wx_plus_b传到activation_function()函数中得到输出。

    最后,返回输出,添加一个神经层的函数——def add_layer()就定义好了。

    import tensorflow as tf
    def add_layer(inputs, in_size, out_size, activation_function=None):
        Weights = tf.Variable(tf.random_normal([in_size, out_size])) #随机变量矩阵Weights大小为in_size行, out_size列
        biases = tf.Variable(tf.zeros([1, out_size]) + 0.1) #随机变量矩阵biases大小为1行, out_size列
        Wx_plus_b = tf.matmul(inputs, Weights) + biases #matmul矩阵乘法
        if activation_function is None:
            outputs = Wx_plus_b
        else:
            outputs = activation_function(Wx_plus_b)
        return outputs
    

    可以看到定义的add_layer()完成的是添加一个神经层的功能,包含weights、biases和激励函数。

    导入数据

    构建所需的数据。 这里的x_data和y_data并不是严格的一元二次函数的关系,因为我们多加了一个noise,这样看起来会更像真实情况。

    import numpy as np
    x_data = np.linspace(-1,1,300, dtype=np.float32)[:, np.newaxis] #数据有300行(300个例子)
    noise = np.random.normal(0, 0.05, x_data.shape).astype(np.float32)
    y_data = np.square(x_data) - 0.5 + noise
    

    numpy.newaxis

    [:, np.newaxis]是给x_data多加一个维度。

    用linspace()方法生成的x_data是一个一维(阶)ndarray,长度为300。

    那么,[:, np.newaxis]就相当于在列向量方向增加维度(阶)。

    numpy.random.normal

    numpy.random.normal(loc=0.0, scale=1.0, size=None)

    利用占位符定义我们所需的神经网络的输入。 tf.placeholder()就是代表占位符,这里的None代表无论输入有多少都可以,因为输入只有一个特征,所以这里是1。

    xs = tf.placeholder(tf.float32, [None, 1])
    ys = tf.placeholder(tf.float32, [None, 1])
    

    接下来,我们就可以开始定义神经层了。
    通常神经层都包括输入层、隐藏层和输出层。这里的输入层只有一个属性, 所以我们就只有一个输入;隐藏层我们可以自己假设,这里我们假设隐藏层有10个神经元; 输出层和输入层的结构是一样的,所以我们的输出层也是只有一层。
    所以,我们构建的是——输入层1个、隐藏层10个、输出层1个的神经网络。

    搭建网络

    下面,我们开始定义隐藏层,利用之前的add_layer()函数,这里使用 Tensorflow 自带的激励函数tf.nn.relu。

    l1 = add_layer(xs, 1, 10, activation_function=tf.nn.relu)
    
    WARNING:tensorflow:From C:\Anaconda\lib\site-packages\tensorflow\python\framework\op_def_library.py:263: colocate_with (from tensorflow.python.framework.ops) is deprecated and will be removed in a future version.
    Instructions for updating:
    Colocations handled automatically by placer.
    

    接着,定义输出层。此时的输入就是隐藏层的输出——l1,输入有10层(隐藏层的输出层),输出有1层。

    prediction = add_layer(l1, 10, 1, activation_function=None)
    

    计算预测值prediction和真实值的误差,对二者差的平方求和再取平均。

    loss = tf.reduce_mean(tf.reduce_sum(tf.square(ys - prediction),
                         reduction_indices=[1]))
    

    reduce_mean

    # 'x' is [[1., 1. ], 
    #         [2., 2.]]
    tf.reduce_mean(x) ==> 1.5
    tf.reduce_mean(x, 0) ==> [1.5, 1.5]
    tf.reduce_mean(x, 1) ==> [1.,  2.]
    

    reduction_indices为0可以看做压缩为行向量。1可以可以看做压缩为列向量。
    不过结果都是一维数组(向量),无所谓行列(不存在行列)。

    reduce_sum

    x = tf.constant([[1, 1, 1], [1, 1, 1]])
    tf.reduce_sum(x)  # 6
    tf.reduce_sum(x, 0)  # [2, 2, 2]
    tf.reduce_sum(x, 1)  # [3, 3]
    

    reduction_indices的定义同上。reduction_indices为0可以看做压缩为行向量。1可以可以看做压缩为列向量。

    接下来,是很关键的一步,如何让机器学习提升它的准确率。tf.train.GradientDescentOptimizer()中的值通常都小于1,这里取的是0.1,代表以0.1的效率来最小化误差loss。

    train_step = tf.train.GradientDescentOptimizer(0.1).minimize(loss)
    
    WARNING:tensorflow:From C:\Anaconda\lib\site-packages\tensorflow\python\ops\math_ops.py:3066: to_int32 (from tensorflow.python.ops.math_ops) is deprecated and will be removed in a future version.
    Instructions for updating:
    Use tf.cast instead.
    

    使用变量时,都要对它进行初始化,这是必不可少的。

    init = tf.global_variables_initializer()
    

    定义Session,并用 Session 来执行 init 初始化步骤。 (注意:在tensorflow中,只有session.run()才会执行我们定义的运算。)

    sess = tf.Session()
    sess.run(init)
    

    训练

    下面,让机器开始学习。

    比如这里,我们让机器学习1000次。机器学习的内容是train_step, 用 Session 来 run 每一次 training 的数据,逐步提升神经网络的预测准确性。 (注意:当运算要用到placeholder时,就需要feed_dict这个字典来指定输入。)

    for i in range(1000):
        # training
        sess.run(train_step, feed_dict={xs: x_data, ys: y_data})
        if i % 50 == 0:
            # to see the step improvement
            print(sess.run(loss, feed_dict={xs: x_data, ys: y_data}))
    
    0.005186392
    0.005067851
    0.004970867
    0.0048804265
    0.0048021255
    0.004729048
    0.004658237
    0.0045880903
    0.004518074
    0.004450137
    0.00438345
    0.004318432
    0.0042556394
    0.0041941707
    0.0041359025
    0.0040782928
    0.0040215612
    0.003965127
    0.0039109406
    0.0038589651
    

    每50步我们输出一下机器学习的误差。
    通过上图可以看出,误差在逐渐减小,这说明机器学习是有积极的效果的。

    相关文章

      网友评论

          本文标题:[tensorflow] 例子3 建造神经网络

          本文链接:https://www.haomeiwen.com/subject/bydrrctx.html