使用反向传播训练多层感知器的原理

作者: 学以致用123 | 来源:发表于2018-08-01 10:17 被阅读4次

关键词:反向传播,backprop,多层感知器(MLP)

本文是一篇译文。

原文来源:http://home.agh.edu.pl/~vlsi/AI/backp_t_en/backprop.html

本文介绍使用反向传播训练多层感知器的原理。这里使用包含两个输入和一个输出的三层神经网络说明训练过程,如下图所示:

img01.gif

每个神经元由两个单元组成。第一个单元对权重系数和输入信号的乘积进行加和。第二个单元实现非线性功能,称为神经元激活函数。信号 e 为第一单元输出信号,y=f(e) 为非线性单元输出信号。信号 y 也是神经元的输出信号。

img01b.gif

我们需要训练数据集来训练神经网络。训练数据集包括输入信号(x1 和 x2)及对应的目标(期望输出)y。神经网络训练是一个迭代过程。每次迭代过程都将使用训练集的新数据修改节点的权重。修改节点权重使用的算法为:每次训练都从训练集的两个输入信号开始;完成这一步之后,我们可以确定每个网络层的每个神经元的输出。下图说明了信号如何在网络中传播,符号 w_{(xm)n} 表示网络输入 x_m与输入层的神经元 n 之间连接的权重。符号 y_n表示神经元n的输出信号。

img02.gif
img03.gif img04.gif

隐藏层的信号传播,符号w_{mn}表示神经元 m 的输出与下一层神经元 n 的输入的连接的权重:

img05.gif
img06.gif

输出层的信号传播:

img07.gif

下一个算法步骤中,网络信号 y 期望的输出值(训练集中的目标)进行比较。这两个值的差称为输出层神经网络的误差信号 d 。

img08.gif

由于不知道内层神经元的输出值,我们无法计算内层神经元的误差信号。训练多层神经网络的有效方法在很多年都是个未解之谜。直到 80 年代中期才有了反向传播算法。反向传播算法的思想是将误差信号 d 反向传入所有神经元,上面过程中神经元的输出变成了输入。

img09.gif img10.gif

反向传输信号的权重系数 w_{mn}与计算输出的权重的值是一样的,只是数据流的方向发生了变化(信号由输出依次传向输入)。将其应用到所有网络层。如下图所示:

img11.gif img12.gif img13.gif

计算完每个神经元的误差信号后,每个神经元的权重系数将发生变化。下面的公式中df(e)/de表示神经激活函数的导数(权重将发生变化)。

img14.gif img15.gif img16.gif img17.gif img18.gif img19.gif

系数 \eta影响网络训练速度。有几种技术可以用于确定这个系数。第一种方法使用很大的值作为系数开始学习,在建立权重系数的同时缩小系数。第二种方法(更复杂)使用较小的值作为系数开始学习,在学习过程中,开始时增大系数,当慢慢接近结果时减少系数。使用较小的系数的训练过程有助于确定权重系数的正负。

参考:

Ryszard Tadeusiewcz "Sieci neuronowe", Kraków 1992

相关文章

  • 使用反向传播训练多层感知器的原理

    关键词:反向传播,backprop,多层感知器(MLP) 本文是一篇译文。原文来源:http://home.agh...

  • 左手信号,右手误差:多层感知器

    在感知器的输入层和输出层之间添加隐藏层,就可以得到多层感知器; 多层感知器是一类前馈神经网络,采用的是反向传播的学...

  • 神经网络入门指南

    摘要:多层感知器和反向传播算法是什么?他们的工作原理又是怎样的?刚刚入门机器学习的你,是不是还在被这些问题困扰呢?...

  • ElitesAI·机器学习进阶打卡第一天2020-02-17

    1、普适逼近定理:多层感知器能够以任意精度逼近任意一个定义在闭集的连续函数 2、反向传播算法和多层感知机 3、 浏...

  • 多层感知器MLP原理

    异或问题(XOR)无法使用单层感知器来做处理,因此可以使用多层感知器

  • 深度学习-机器学习

    零基础入门深度学习(1) - 感知器 机器学习 | Coursera 深度学习笔记(一)感知器、梯度下降、反向传播...

  • Batch Normalization

    一、不使用Batch Normalization 对某层的前向传播过程有:针对该层的反向传播过程为:连续多层的梯度...

  • BP算法

    BP算法 简介BP算法 BP算法是由学习过程由信号的正向传播与误差的反向传播两个过程组成。由于多层前馈网络的训练经...

  • 姓名:于倩学号:21011210116学院:通信工程学院

    BP神经网络是前馈神经网络的一种,是指用反向传播算法(BP算法)进行训练的多层前馈神经网络,它包括信号的前向传播和...

  • DL01-3:感知器实现(标量版)

    摘要:1、使用标量实现感知器;2、使用鸢尾花作为训练与测试样本; 鸢尾花: 一、感知器算法与公式 1、感知器训练算...

网友评论

    本文标题:使用反向传播训练多层感知器的原理

    本文链接:https://www.haomeiwen.com/subject/eujlvftx.html