美文网首页
TensorFlow入门(三)实现一个神经网络

TensorFlow入门(三)实现一个神经网络

作者: 又双叒叕苟了一天 | 来源:发表于2018-07-17 19:50 被阅读0次

    神经网络的前向传播

    该神经网络为三层:输入层(2个结点),隐藏层(3个结点),输出层(1个结点)各一层。不采用激活函数,也不考虑偏置项。

    w1 = tf.Variable(tf.random_normal([2, 3], stddev=1))
    w2 = tf.Variable(tf.random_normal([3, 1], stddev=1))
    
    #设置占位符,在run的时候通过指定feed_dict参数直接给出输入的数据
    x = tf.placeholder(tf.float32, shape=(1, 2), name="input")
    
    a = tf.matmul(x, w1)#matmul为两个矩阵的乘法运算
    y = tf.matmul(a, w2)
    
    with tf.Session():
        #初始化参数
        init_op = tf.global_variables_initializer()
        sess.run(init_op)
        
        #完成前向的运算,feed_dict参数指定输入的数据,x可以为多个数据,由此产生多个输出
        #例如:feed_dict={x:[0.1, 0.2], [0.5, 0.8],...},占位符设置时shape要跟着改变
        print(sess.run(y, feed_dict={x: [0.7, 0.9]}))
    

    对输出的y通过sigmoid函数转化为概率

    对于二分问题,我们可以只输出一个值,表示为正样本的概率,也可以输出两个值:[0, 1]和[1, 0]来表示两个分类。对于只输出一个值的情况,我们通常对输出y用sigmoid函数转化为概率表示:

    y = tf.sigmoid(y)
    

    定义损失函数

    #这里采用的是比较常用的交叉熵误差作为损失函数
    cross_entropy = -tf.reduce_mean(#reduce_mean对多组数据的误差和取均值
        #tf.clip_by_value(y, 1e-10, 1.0)对y的取值进行裁剪,小于1e-10取1e-10,大于1.0取1.0,保证log能算
        y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0)
        + (1-y)*tf.log(tf.clip_by_value(1-y, 1e-10, 1.0)))
    

    定义学习率并采用优化算法

    learning_rate = 0.001#学习率设置为0.001
    #采用AdamOptimizer优化算法,以学习率learning_rate去优化损失函数cross_entropy
    train_step = tf.train.AdamOptimizer(learning_rate).minimize(cross_entropy)
    

    完整的神经网络样例程序

    import tensorflow as tf
    from numpy.random import RandomState
    
    #每8个样本更新一轮参数
    batch_size = 8
    
    #参数初始化
    w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1))
    w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1))
    
    #前向的计算
    x = tf.placeholder(tf.float32, shape=(None, 2), name="x-input")
    y = tf.placeholder(tf.float32, shape=(None, 1), name="y-input")
    
    a = tf.matmul(x, w1)
    y = tf.matmul(a, w2)
    
    y = tf.sigmoid(y)
    
    #选择损失函数,学习率,优化算法
    cross_entropy = -tf.reduce_mean(
        y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0)
        + (1-y)*tf.log(tf.clip_by_value(1-y, 1e-10, 1.0)))
    train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy)
    
    #自己构建一个数据集,并自动产生标签
    rdm = RandomState(1)#产生一个随机数种子
    dataset_size = 128#数据集有128条数据
    X = rdm.rand(dataset_size, 2)
    Y = [[int(x1+x2 <1)] for (x1, x2) in X]#按这个规则自动产生label
        
    
    with tf.Session() as sess:
        #初始化参数
        init_op = tf.global_variables_initializer()
        sess.run(init_op)
        
        STEPS = 5000#训练5000轮
        for i in range(STEPS):
            start = (i * batch_size) % data_size
            end = min(start+batch_size, dataset_size)
            sess.run(train_step, feed_dict={x: X[start:end], y_: Y[start:end]})
            if i % 1000 == 0:#每1000轮输出一次,整个样本的交叉熵误差
                total_cross_entropy = sess.run(cross_entropy, feed_dict={x: X, y_: Y})
                print("After %d training step(s), cross entropy on all data is %g" % (i,                            total_cross_entropy))
        #查看训练完后的两个参数矩阵
        print(sess.run(w1))
        print(sess.run(w2))
    

    相关文章

      网友评论

          本文标题:TensorFlow入门(三)实现一个神经网络

          本文链接:https://www.haomeiwen.com/subject/uhwgpftx.html