神经网络和深度学习 - Chapter3 浅层神经网络

神经网络和深度学习 - Chapter3 浅层神经网络

作者: nlpming | 来源:发表于2021-09-15 16:44 被阅读0次

神经网络和深度学习 - Chapter3 浅层神经网络
卷积神经网络记录
1.3 浅层神经网络（One hidden layer Neur
18-tensorflow
深度学习笔记之循环神经网络RNN学习笔记
BP神经网络的梳理
《Python神经网络》5——机器学习简介
神经网络和深度学习的简史
图床
学习笔记: 深度学习入门：基于 Python 的理论与实现第三

什么是神经网络？

下面这个浅层神经网络，由多个Logistic Regression堆叠而成；浅层神经网络的反向传播过程，和逻辑回归类似；
其中， $z^{[1]}$ 表示第一层神经网络的z值；上表 $[1]$ 表示第1层神经网络；
image.png

神经网络表示

一个简单的三层神经网络结构如下所示；
其中第一个隐藏层激活值： $a^{[1]} = \left[a^{[1]}_1, a^{[1]}_2, a^{[1]}_3, a^{[1]}_4 \right]^T$

image.png
每一个神经网络的激活值计算；
$z^{[1]}_1 = w^{[1]T}_1 x + b^{[1]}_1$ ，其中 $w^{[1]}_1 \in (3, 1), x \in (3, 1)$

image.png
浅层神经网络前向传播向量化表示；
$z^{[1]} = W^{[1]}x + b^{[1]}; a^{[1]} = \sigma(z^{[1]})$

image.png
image.png

多个样本浅层网络向量化

将 $m$ 个样本结果堆叠在一起： $z^{[1]} = \left[ z^{[1](1)}, z^{[1](2)}, ...,z^{[1](m)} \right]$ , 其中每一个结果 $z^{[1](i)}$ 都是一个列向量；

image.png

多个样本浅层网络向量化公式如下： $Z^{[1]} = W^{[1]}X + b^{[1]}$ ，其中 $W^{[1]} \in (h_1, n_x), X \in (n_x, m), b^{[1]} \in (h_1, 1)$
$Z^{[2]} = W^{[2]}A^{[1]} + b^{[2]}$ ，其中 $W^{[2]} \in (h_2, h_1), A^{[1]} \in (h_1, m), b^{[2]} \in (h_2, 1)$

多个样本浅层网络向量化表达.png

神经网络激活函数

常用的激活函数有：sigmoid，tanh，relu，leaky relu；
sigmoid一般在二分类的输出层使用，其他情况一般使用relu，或者tanh激活函数；
leaky relu主要是弥补，relu激活函数在x取值为负数的时候导数为0；

常见激活函数.png

神经网络为什么需要非线性激活函数？

隐藏层使用线性激活函数，无论堆叠多少层只能建模输入输出的线性关系；

线性激活函数.png

激活函数的导数

sigmoid激活函数导数： $g'(z) = g(z) \left[1- g(z)\right]$ ；
tanh激活函数导数： $g'(z) = 1 - \left[ g(z) \right]^2$ ；

sigmoid激活函数导数.png

tanh激活函数导数.png

relu和Leaky relu激活函数导数.png

浅层神经网络梯度求导

三层神经网络，参数求导过程如下：

image.png

三层神经网络前向&反向传播过程.png

神经网络参数初始化

为什么不要把网络参数都初始化为0 ？ 因为参数 $W$ 的行与行之间是一样的，导致同一隐藏层的结点激活值是一样的。这样每次神经同一层神经网络结点学到的是同样的函数，即是对称的；这样堆叠多个神经元没有任何意义。
解决方法是随机初始化网络参数，但是网络参数值不宜太大。因为对于sigmoid, tanh等这类激活函数，在取值很大的时候其导数接近于0，容易出现梯度消失问题；

神经网络参数初始化为0的弊端.png

随机初始化网络参数.png

相关文章

神经网络和深度学习 - Chapter3 浅层神经网络
什么是神经网络？下面这个浅层神经网络，由多个Logistic Regression堆叠而成；浅层神经网络的反向传...
卷积神经网络记录
1、深度学习发展史大致经历两次浪潮：浅层学习，深度学习 Geoffrey Hinton 神经网络之父 AlexN...
1.3 浅层神经网络（One hidden layer Neur
从今天开始，本人将继续学习吴恩达教授的深度学习课程第一部分神经网络和深度学习第三周浅层神经网络的相关课程，这部分课...
18-tensorflow
基础深度学习介绍深度学习，如深度神经网络、卷积神经网络和递归神经网络已被应用计算机视觉、语音识别、自然语言处理...
深度学习笔记之循环神经网络RNN学习笔记
关键词：循环神经网络；RNN；深度学习；深度神经网络循环神经网络 RNN 李宏毅：机器学习，深度学习的课件参考...
BP神经网络的梳理
一 BP 神经网络简介（1）BP神经网络在深度学习的地位 BP神经网络被称为“深度学习之旅的开端”，是神经网络的...
《Python神经网络》5——机器学习简介
1.机器学习，神经网络，深度学习和人工智能之间有什么关系？ · 神经网络是深度学习的“根基”。 · 深度学习是机器...
神经网络和深度学习的简史
神经网络和深度学习的简史神经网络如何从最早的人工智能时代发展到现在的故事。神经网络和深度学习的简史序幕——深...
图床
浅层神经网络：
学习笔记: 深度学习入门：基于 Python 的理论与实现第三
chapter3 神经网络 3.1 从感知机到神经网络神经网络的一个重要性质是它可以自动地从数据中学习到...

网友评论

本文标题：神经网络和深度学习 - Chapter3 浅层神经网络

本文链接：https://www.haomeiwen.com/subject/lazcgltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|神经网络和深度学习 - Chapter3 浅层神经网络|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！