本文来自例子3 建造神经网络
代码:tf11_build_network/full_code.py
在此基础上加上了自己(粘贴)的笔记。
定义 add_layer()
在 Tensorflow 里定义一个添加层的函数可以很容易的添加神经层,为之后的添加省下不少时间.
神经层里常见的参数通常有weights、biases和激励函数。
首先,我们需要导入tensorflow模块。
-
然后定义添加神经层的函数def add_layer(),它有四个参数:输入值、输入的大小、输出的大小和激励函数,我们设定默认的激励函数是None。
-
接下来,我们开始定义weights和biases。
- 因为在生成初始参数时,随机变量(normal distribution)会比全部为0要好很多,所以我们这里的weights为一个in_size行, out_size列的随机变量矩阵。
- biases的推荐值不为0,所以我们这里是在0向量的基础上又加了0.1。
-
下面,我们定义Wx_plus_b, 即神经网络未激活的值。其中,tf.matmul()是矩阵的乘法。
-
当activation_function——激励函数为None时,输出就是当前的预测值——Wx_plus_b,不为None时,就把Wx_plus_b传到activation_function()函数中得到输出。
最后,返回输出,添加一个神经层的函数——def add_layer()就定义好了。
import tensorflow as tf
def add_layer(inputs, in_size, out_size, activation_function=None):
Weights = tf.Variable(tf.random_normal([in_size, out_size])) #随机变量矩阵Weights大小为in_size行, out_size列
biases = tf.Variable(tf.zeros([1, out_size]) + 0.1) #随机变量矩阵biases大小为1行, out_size列
Wx_plus_b = tf.matmul(inputs, Weights) + biases #matmul矩阵乘法
if activation_function is None:
outputs = Wx_plus_b
else:
outputs = activation_function(Wx_plus_b)
return outputs
可以看到定义的add_layer()完成的是添加一个神经层的功能,包含weights、biases和激励函数。
导入数据
构建所需的数据。 这里的x_data和y_data并不是严格的一元二次函数的关系,因为我们多加了一个noise,这样看起来会更像真实情况。
import numpy as np
x_data = np.linspace(-1,1,300, dtype=np.float32)[:, np.newaxis] #数据有300行(300个例子)
noise = np.random.normal(0, 0.05, x_data.shape).astype(np.float32)
y_data = np.square(x_data) - 0.5 + noise
numpy.newaxis
[:, np.newaxis]是给x_data多加一个维度。
用linspace()方法生成的x_data是一个一维(阶)ndarray,长度为300。
那么,[:, np.newaxis]就相当于在列向量方向增加维度(阶)。
numpy.random.normal
numpy.random.normal(loc=0.0, scale=1.0, size=None)
利用占位符定义我们所需的神经网络的输入。 tf.placeholder()就是代表占位符,这里的None代表无论输入有多少都可以,因为输入只有一个特征,所以这里是1。
xs = tf.placeholder(tf.float32, [None, 1])
ys = tf.placeholder(tf.float32, [None, 1])
接下来,我们就可以开始定义神经层了。
通常神经层都包括输入层、隐藏层和输出层。这里的输入层只有一个属性, 所以我们就只有一个输入;隐藏层我们可以自己假设,这里我们假设隐藏层有10个神经元; 输出层和输入层的结构是一样的,所以我们的输出层也是只有一层。
所以,我们构建的是——输入层1个、隐藏层10个、输出层1个的神经网络。
搭建网络
下面,我们开始定义隐藏层,利用之前的add_layer()函数,这里使用 Tensorflow 自带的激励函数tf.nn.relu。
l1 = add_layer(xs, 1, 10, activation_function=tf.nn.relu)
WARNING:tensorflow:From C:\Anaconda\lib\site-packages\tensorflow\python\framework\op_def_library.py:263: colocate_with (from tensorflow.python.framework.ops) is deprecated and will be removed in a future version.
Instructions for updating:
Colocations handled automatically by placer.
接着,定义输出层。此时的输入就是隐藏层的输出——l1,输入有10层(隐藏层的输出层),输出有1层。
prediction = add_layer(l1, 10, 1, activation_function=None)
计算预测值prediction和真实值的误差,对二者差的平方求和再取平均。
loss = tf.reduce_mean(tf.reduce_sum(tf.square(ys - prediction),
reduction_indices=[1]))
reduce_mean
# 'x' is [[1., 1. ],
# [2., 2.]]
tf.reduce_mean(x) ==> 1.5
tf.reduce_mean(x, 0) ==> [1.5, 1.5]
tf.reduce_mean(x, 1) ==> [1., 2.]
reduction_indices为0可以看做压缩为行向量。1可以可以看做压缩为列向量。
不过结果都是一维数组(向量),无所谓行列(不存在行列)。
reduce_sum
x = tf.constant([[1, 1, 1], [1, 1, 1]])
tf.reduce_sum(x) # 6
tf.reduce_sum(x, 0) # [2, 2, 2]
tf.reduce_sum(x, 1) # [3, 3]
reduction_indices的定义同上。reduction_indices为0可以看做压缩为行向量。1可以可以看做压缩为列向量。
接下来,是很关键的一步,如何让机器学习提升它的准确率。tf.train.GradientDescentOptimizer()中的值通常都小于1,这里取的是0.1,代表以0.1的效率来最小化误差loss。
train_step = tf.train.GradientDescentOptimizer(0.1).minimize(loss)
WARNING:tensorflow:From C:\Anaconda\lib\site-packages\tensorflow\python\ops\math_ops.py:3066: to_int32 (from tensorflow.python.ops.math_ops) is deprecated and will be removed in a future version.
Instructions for updating:
Use tf.cast instead.
使用变量时,都要对它进行初始化,这是必不可少的。
init = tf.global_variables_initializer()
定义Session,并用 Session 来执行 init 初始化步骤。 (注意:在tensorflow中,只有session.run()才会执行我们定义的运算。)
sess = tf.Session()
sess.run(init)
训练
下面,让机器开始学习。
比如这里,我们让机器学习1000次。机器学习的内容是train_step, 用 Session 来 run 每一次 training 的数据,逐步提升神经网络的预测准确性。 (注意:当运算要用到placeholder时,就需要feed_dict这个字典来指定输入。)
for i in range(1000):
# training
sess.run(train_step, feed_dict={xs: x_data, ys: y_data})
if i % 50 == 0:
# to see the step improvement
print(sess.run(loss, feed_dict={xs: x_data, ys: y_data}))
0.005186392
0.005067851
0.004970867
0.0048804265
0.0048021255
0.004729048
0.004658237
0.0045880903
0.004518074
0.004450137
0.00438345
0.004318432
0.0042556394
0.0041941707
0.0041359025
0.0040782928
0.0040215612
0.003965127
0.0039109406
0.0038589651
每50步我们输出一下机器学习的误差。
通过上图可以看出,误差在逐渐减小,这说明机器学习是有积极的效果的。
网友评论