神经网络的前向传播
该神经网络为三层:输入层(2个结点),隐藏层(3个结点),输出层(1个结点)各一层。不采用激活函数,也不考虑偏置项。
w1 = tf.Variable(tf.random_normal([2, 3], stddev=1))
w2 = tf.Variable(tf.random_normal([3, 1], stddev=1))
#设置占位符,在run的时候通过指定feed_dict参数直接给出输入的数据
x = tf.placeholder(tf.float32, shape=(1, 2), name="input")
a = tf.matmul(x, w1)#matmul为两个矩阵的乘法运算
y = tf.matmul(a, w2)
with tf.Session():
#初始化参数
init_op = tf.global_variables_initializer()
sess.run(init_op)
#完成前向的运算,feed_dict参数指定输入的数据,x可以为多个数据,由此产生多个输出
#例如:feed_dict={x:[0.1, 0.2], [0.5, 0.8],...},占位符设置时shape要跟着改变
print(sess.run(y, feed_dict={x: [0.7, 0.9]}))
对输出的y通过sigmoid函数转化为概率
对于二分问题,我们可以只输出一个值,表示为正样本的概率,也可以输出两个值:[0, 1]和[1, 0]来表示两个分类。对于只输出一个值的情况,我们通常对输出y用sigmoid函数转化为概率表示:
y = tf.sigmoid(y)
定义损失函数
#这里采用的是比较常用的交叉熵误差作为损失函数
cross_entropy = -tf.reduce_mean(#reduce_mean对多组数据的误差和取均值
#tf.clip_by_value(y, 1e-10, 1.0)对y的取值进行裁剪,小于1e-10取1e-10,大于1.0取1.0,保证log能算
y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0)
+ (1-y)*tf.log(tf.clip_by_value(1-y, 1e-10, 1.0)))
定义学习率并采用优化算法
learning_rate = 0.001#学习率设置为0.001
#采用AdamOptimizer优化算法,以学习率learning_rate去优化损失函数cross_entropy
train_step = tf.train.AdamOptimizer(learning_rate).minimize(cross_entropy)
完整的神经网络样例程序
import tensorflow as tf
from numpy.random import RandomState
#每8个样本更新一轮参数
batch_size = 8
#参数初始化
w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1))
#前向的计算
x = tf.placeholder(tf.float32, shape=(None, 2), name="x-input")
y = tf.placeholder(tf.float32, shape=(None, 1), name="y-input")
a = tf.matmul(x, w1)
y = tf.matmul(a, w2)
y = tf.sigmoid(y)
#选择损失函数,学习率,优化算法
cross_entropy = -tf.reduce_mean(
y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0)
+ (1-y)*tf.log(tf.clip_by_value(1-y, 1e-10, 1.0)))
train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy)
#自己构建一个数据集,并自动产生标签
rdm = RandomState(1)#产生一个随机数种子
dataset_size = 128#数据集有128条数据
X = rdm.rand(dataset_size, 2)
Y = [[int(x1+x2 <1)] for (x1, x2) in X]#按这个规则自动产生label
with tf.Session() as sess:
#初始化参数
init_op = tf.global_variables_initializer()
sess.run(init_op)
STEPS = 5000#训练5000轮
for i in range(STEPS):
start = (i * batch_size) % data_size
end = min(start+batch_size, dataset_size)
sess.run(train_step, feed_dict={x: X[start:end], y_: Y[start:end]})
if i % 1000 == 0:#每1000轮输出一次,整个样本的交叉熵误差
total_cross_entropy = sess.run(cross_entropy, feed_dict={x: X, y_: Y})
print("After %d training step(s), cross entropy on all data is %g" % (i, total_cross_entropy))
#查看训练完后的两个参数矩阵
print(sess.run(w1))
print(sess.run(w2))
网友评论