美文网首页
非线性建模-神经网络

非线性建模-神经网络

作者: 火羽白panda | 来源:发表于2018-06-09 09:48 被阅读0次

        这学期选修了Python与算法基础,利用Python语言编写力图实现高效算法。前期接触了线性建模中的单变量及多元变量回归模型、多项式回归和灰度模型等。目前正在解决非线性建模问题,引入了神经网络的概念,这里作为自我梳理。

        首先该网络有三层:输入层、隐含层和输出层。输入层进行变量与优化权重的加权计算,每个节点输出z=Σxiwij,此时我们把多个变量(x),变为了单个变量(z)。隐含层完成“非线性的实现”,节点值ho=1/((1+e^(-z))),此处使用了生长函数。当我们调节wij(优化权重),使模型收敛,就能解决该非线性问题。

神经网络模型三层结构

        接着我们建立MLPClassifier神经网络模型。以下辨明多个参数。

hidden_layer_sizes:用元组,一个数字代表一个隐含层的节点。如hidden_layer_sizes=(50,50) 两个隐含层,每层50个节点hidden_layer_sizes=(60,) 一个隐含层,60个节点,其中逗号不能省略

activation:激活函数, 对Σxiwij的函数转换。

{'identity','logistic', 'tanh', 'relu'}, 默认relu                                                

•identity:f(x)= x

•logistic:其实就是sigmod,f(x) = 1 / (1 + exp(-x)).

•tanh:f(x) = tanh(x).

•relu:f(x) = max(0, x)

solver: {'bfgs', 'sgd', 'adam'}, 默认adam,用来优化权重

lbfgs:quasi-Newton(拟牛顿法)方法的优化器

sgd:随机梯度下降

adam: Kingma, Diederik, and Jimmy Ba提出的基于随机梯度的优化器

注意:默认solver 'adam',在相对较大的数据集上效果比较好(几千个样本或者更多),对小数据集来说,lbfgs收敛更快效果也更好。

随机梯度下降法,参考:机器学习笔记(一):梯度下降算法,随机梯度下降,正规方程https://blog.csdn.net/qer_computerscience/article/details/55061521

主要是对误差之和最小函数J(θ)求偏导,得到J的梯度,即J下降最快的方向。通过这个方向更新参数θ,θi=θi-α(J'(θ)) ( α是手动设置的学习速率参数 ),使得J的值越来越小。但是每次都遍历所有样本数据(完全梯度下降法),会花费大量时间,所以使用随机梯度下降法:对于每一次更新参数,仅仅使用一个数据,来变换一个参数。这样既保证了精确度,也提高了效率。

随机梯度下降算法,j=1:m

learning_rate :学习率,用于权重更新,只有当solver为’sgd’时使用,{'constant','invscaling', 'adaptive'},默认constant

•constant: 由learning_rate_init给定的恒定学习率

•invscaling:随着时间t使用power_t的逆标度指数不断降低学习率learning_rate_ ,effective_learning_rate = learning_rate_init / pow(t, power_t)

•adaptive:只要训练损耗在下降,就保持学习率为learning_rate_init不变,当连续两次不能降低训练损耗或验证分数停止升高至少tol时,将当前学习率除以5。


实验: 使用验证集建立MLPClassifier模型,并使用建立的模型预测验证集

''''''''''''''''''''''''''''''''''''''''''''''''''' 画图 '''''''''''''''''''''''''''''''''''''''''''''''''''

import numpy as np X=np.loadtxt(r'D:\课件\Python与算法基础\12周数据\1x1.txt')#data Y=np.loadtxt(r'D:\课件\Python与算法基础\12周数据\1y1.txt')#target import matplotlib.pyplot as plt plt.plot(X[Y==1,0],X[Y==1,1],"b^") plt.plot(X[Y==0,0],X[Y==0,1],"ro") plt.show()

''''''''''''''''''''''''''''''''''''''''''''''''''' 准备数据 '''''''''''''''''''''''''''''''''''''''''''''''''''

from sklearn.model_selection import train_test_split #拆分训练集和测试集 from sklearn.preprocessing import StandardScaler from sklearn.neural_network import MLPClassifier h = .2 X=np.loadtxt(r"D:\课件\Python与算法基础\12周数据\1x1.txt") y=np.loadtxt(r"D:\课件\Python与算法基础\12周数据\1y1.txt") figure = plt.figure() X = StandardScaler().fit_transform(X) #线性拟合,插值法 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.4)#40%作为test

''''''''''''''''''''''''''''''''''''''''''''''''''' 数据初始化 '''''''''''''''''''''''''''''''''''''''''''''''''''

x_min = X[:, 0].min() - .5 x_max = X[:, 0].max() + .5 y_min = X[:, 1].min() - .5 y_max = X[:, 1].max() + .5 xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))

''''''''''''''''''''''''''''''''''''''''''''''''''' 建模及预测 '''''''''''''''''''''''''''''''''''''''''''''''''''

cm = plt.cm.Accent cm_bright = ListedColormap(['#FF0000', '#0000FF']) clf=MLPClassifier(hidden_layer_sizes=(100,), alpha=1e-5, random_state=1)#random_state=1时,每次计算结果一样 clf.fit(X_train, y_train) score = clf.score(X_test, y_test) print(score)

''''''''''''''''''''''''''''''''''''''''''''''''''' 数据可视化 '''''''''''''''''''''''''''''''''''''''''''''''''''

Z = clf.predict_proba(np.c_[xx.ravel(), yy.ravel()])[:, 1] # 用来预测样本分成某一类的概率,ravel平铺,制作概率的等高线图 Z = Z.reshape(xx.shape) ax = plt.subplot(1, 1, 1) ax.contourf(xx, yy, Z, cmap=cm) # 画训练集点 ax.scatter(X_train[:, 0], X_train[:, 1], c=y_train, cmap=cm_bright, edgecolors='black', s=25) # 画测试集点 ax.scatter(X_test[:, 0], X_test[:, 1], c=y_test,cmap=cm_bright, alpha=0.3, edgecolors='black', s=25) ax.set_xlim(xx.min(), xx.max()) ax.set_ylim(yy.min(), yy.max()) ax.set_xticks(()) ax.set_yticks(()) plt.show()

相关文章

  • 非线性建模-神经网络

    这学期选修了Python与算法基础,利用Python语言编写力图实现高效算法。前期接触了线性建模中的单变量及多元变...

  • 4. 深度学习-损失函数

    我们知道神经网络是一种非线性模型,激活函数就是用来映射为非线性的,激活函数是保证神经网络非线性的关键。但是模型的参...

  • 激活函数总结

    简介 因为神经网络是线性组合,激活函数给神经元引入了非线性因素,使得神经网络可以任意逼近任何非线性函数,这样神经网...

  • 总结什么是深度学习

    维基百科对深度学习定于为‘一类通过多层非线性变换对高复杂性数据建模算法的合集’,因为深层神经网络是实现 ‘多层非线...

  • 2019-07-15

    今天继续搞数学建模,用matlab改写非线性规划问题

  • 吴恩达-机器学习笔记(第四周)

    第八、神经网络:表述(Neural Networks: Representation 8.1 非线性假设   本节...

  • 树回归

    原理: 将数据集切分成很多份易建模的数据 利用线性回归技术建模 优点 可以对复杂和非线性的数据建模 缺点 结果不易...

  • mxnet:神经网络的激活函数

    1.为什么激活函数必须为非线性? 为保证非线性,激活函数必须为非线性函数.要让你的神经网络能够计算出有趣的函数,你...

  • BP神经网络的非线性系统建模

    背景 在工程应用中经常会遇到一些复杂的非线性系统(我们航空发动机就是典型的强非线性模型),这些系统状态方程复杂,难...

  • Chapter4 2018-03-20

    深层神经网络 激活函数 - 非线性 ReLU,sigmoid, tanh..... 损失函数 分类问题- 交叉熵...

网友评论

      本文标题:非线性建模-神经网络

      本文链接:https://www.haomeiwen.com/subject/zsfteftx.html