美文网首页程序员深度学习
神经网络入门(F) 添加神经层

神经网络入门(F) 添加神经层

作者: zidea | 来源:发表于2019-07-09 06:32 被阅读11次
MachineLearninginMarketing

添加和定义神经层

神经层中包括一个激励函数,不过在今天的神经层我们暂时不使用激励函数来改变我们线性函数。在每一个神经层中都会包含 weight(权重)、 biases(偏值)和激励函数。这也是我们在节点。
简单的过程就是求解方程系数 Weight 和 biases。在 TensorFlow 输入和输出都是张量

def add_layer(inputs, in_size, out_size, activation_function=None):
    Weights = tf.Variable(tf.random_normal([in_size, out_size]))
    biases = tf.Variable(tf.zeros([1, out_size]) + 0.1)
    Wx_plus_b = tf.matmul(inputs, Weights) + biases
    if activation_function is None:
        outputs = Wx_plus_b
    else
        outputs = activation_function(Wx_plus_b)
    return outputs
  • inputs 传入数据,in_size 表示输入节点,out_size 表示输出的节点数。
  • Weights 定义初始值为一个随机变量,随机变量在生成初始位置要比全部为 0 好的多
Weights = tf.Variable(tf.random_normal([in_size, out_size]))
  • tf.random_normal 表示正态分布
biases = tf.Variable(tf.zeros([1, out_size]) + 0.1)
  • biases 偏置也尽量避免使用 0 作为初始值,tf.zeros 产生全 0 数组

如果 activation_function 是 None 表示,模型为线性的方式而不是非线性的方程

if activation_function is None:

用于解决我们平时生活当中不能用线性方程解决和概括的问题。线性方程是我们加班越多领导就越喜欢而且拿的也更多。其实也不一定因为我们是由极限的,而且一天就 24 小时所以这个问题就从线性变成非线性的问题。我们将神经网络简化为一个公式,也就是 y = Wx ,我们需要表示上面描述问题,不过这个线性方程并不能改变直线形态,这时候我们就需要激励函数。y AF(Wx) 可以在瓶颈处改变我们函数的形态。AF 就是激励函数,有很多方式例如 relu , sigmoid 或者 tanh。也可以自己定义激励函数来解决问题,不过需要保证这些激励函数是可以微分的。

  • 如果设计神经网络的隐藏层数不多,可以随意尝试预定义激励函数
  • 多层需要精心选择激励函数,否则可能会引起梯度爆炸或梯度消失的问题
  • 卷积神经网络推荐 relu,在循环神经网推荐 relu 或者 tanh

如何建立神经网络的结构,

import tensorflow as tf
import numpy as np

def add_layer(inputs, in_size, out_size, activation_function=None):
    Weights = tf.Variable(tf.random_normal([in_size, out_size]))
    biases = tf.Variable(tf.zeros([1, out_size]) + 0.1)
    Wx_plus_b = tf.matmul(inputs, Weights) + biases
    if activation_function is None:
        outputs = Wx_plus_b
    else:
        outputs = activation_function(Wx_plus_b)
    return outputs

x_data = np.linspace(-1, 1, 300)[:,np.newaxis]
noise = np.random.normal(0, 0.05, x_data.shape)
y_data = np.square(x_data) - 0.5 + noise

xs = tf.placeholder(tf.float32,[None, 1])
ys = tf.placeholder(tf.float32,[None, 1])

hiddenLayer = add_layer(xs, 1, 10, activation_function=tf.nn.relu)

outputLayer = add_layer(hiddenLayer, 10, 1, activation_function=None)

loss = tf.reduce_mean(tf.reduce_sum(
    tf.square(ys - outputLayer), reduction_indices=[1]))

train_step = tf.train.GradientDescentOptimizer(0.1).minimize(loss)

init = tf.initialize_all_variables()
sess = tf.Session()
sess.run(init)

for i in range(1000):
    sess.run(train_step, feed_dict={xs: x_data, ys: y_data})
    if i % 50:
        print(sess.run(loss,feed_dict={xs: x_data, ys: y_data}))

Session(会话)用来执行定义好运算,在 TensorFlow 的会话中会拥有并管理 TensorFlow 程序运行的所有资源,计算完毕之后需要关闭会话。

x_data = np.linspace(-1, 1, 300)[:,np.newaxis]
print(x_data)
[[-1.        ]
 [-0.99331104]

x1 = np.array([1, 2, 3, 4, 5])
# the shape of x1 is (5,)
x1_new = x1[:, np.newaxis]
# now, the shape of x1_new is (5, 1)
# array([[1],
#        [2],
#        [3],
#        [4],
#        [5]])
x1_new = x1[np.newaxis,:]
# now, the shape of x1_new is (1, 5)
# array([[1, 2, 3, 4, 5]])

np.newaxis的作用就是在这一位置增加一个一维,这一位置指的是np.newaxis所在的位置,比较抽象,需要配合例子理解。
x_data 通过为他添加维度表示有 300 例子

noise = np.random.normal(0, 0.05, x_data.shape)
y_data = np.square(x_data) - 0.5 + noise

创建 y = x*2 -0.5 添加一个 noise 上 y_data 在这条直线附近跳动。
我们创建一个 3 层的神经网结构,输入层、输出层以及隐藏层,输入层是根据输入数据数量作为输入层,这里 x_data 只有一个属性也就是输入只有一个神经元,而隐藏层我们假设有 10 个属性而输出也只有一个属性所以输出也就是 1。
先定义隐藏层

hiddenLayer = add_layer(xs, 1, 10, activation_function=tf.nn.relu)

接下来定义输出层

outputLayer = add_layer(hiddenLayer, 10, 1, activation_function=None)

定义好神经层,我们就可以开始进行预测,在开始预测之前我们需要计算 loss(误差)也就是我们输出层值(预测值)与实际值的差

loss = tf.reduce_mean(tf.reduce_sum(
    tf.square(ys - outputLayer), reduction_indices=[1]))

reduce_sum 对每一个差值进行求和然后在用 reduce_mean 取平均值。
然后就是定义训练,训练过程是让模型怎么通过学习来减少 loss(误差)

train_step = tf.train.GradientDescentOptimizer(0.1).minimize(loss)

其中 GradientDescentOptimizer 为梯度下降算法的优化,通常我们需要传入一个小于 1 数据作为其参数就行。

init = tf.initialize_all_variables()

对所有变量进行初始,并通过会话来调用 Tensorflow 来进行初始化运算

xs = tf.placeholder(tf.float32,[None, 1])
ys = tf.placeholder(tf.float32,[None, 1])

xs 和 ys 通过 placeholder 表示两个占位符,等待运算时候输入数据到占位符,None 表示样板数量不确定

sess.run(train_step, feed_dict={xs: x_data, ys: y_data})

我们可以看出输出的 loss(误差)是在不断减少,所以说明我们训练是有效的。

0.13406475
0.1070772
0.08847566
0.07542249
0.06607084
0.059247475
0.05415783
0.050249428
...
0.0031619053
0.0031612993
0.0031606962
0.0031600953
0.0031594988

相关文章

  • 神经网络入门(F) 添加神经层

    添加和定义神经层 神经层中包括一个激励函数,不过在今天的神经层我们暂时不使用激励函数来改变我们线性函数。在每一个神...

  • Python深度学习-3.神经网络入门

    3.神经网络入门 3.1神经网络剖析 层,多个层组合成网络(或模型) 输入数据和相应的目标 损失函数,即用于学习的...

  • Tensorflow机器学习5 创建神经网络

    1、创建添加层函数 2、创建神经网络 运行结果: 3、添加可视化

  • 反向传播神经网络极简入门

    源地址:反向传播神经网络极简入门 目录单个神经元神经元Sigmoid函数神经网络模型前向传播后向传播符号定义输出层...

  • 感知器

    机器学习之神经网络 神经网络是由神经元连接而组成,神经网络由输入层、输出层、隐藏层组成。(隐藏层大于2称作深度神经...

  • 卷积神经网络

    卷积神经网络 卷积神经网络2 池化层 激活层 全连接层 过拟合

  • 深度学习 第3次作业 浅层神经网络

    1.神经网络概述 2.神经网络表示及计算 3、神经网络的向量化表达及解释对于两层神经网络,从输入层到隐藏层对应一次...

  • cnn学习资料

    1, 卷积神经网络 从原理到实现 2,线性回归理解 3,从入门到精通:卷积神经网络初学者指南 4,知乎:全理解层的...

  • CS231n 卷积神经网络: 架构, 卷积/池化层(上)

    卷积神经网络: 架构, 卷积/池化层(上) 卷积神经网络: 架构, 卷积/池化层(上) 卷积神经网络(CNNs/C...

  • 神经网络和深度学习 - Chapter4 深层神经网络

    浅层、深层神经网络对比 深层神经网络符号定义: 表示神经网络的层数; 表示第层神经元个数; 表示第层神经元激活值;...

网友评论

    本文标题:神经网络入门(F) 添加神经层

    本文链接:https://www.haomeiwen.com/subject/qmyuhctx.html