6.1深度学习的神经网络中的训练难点

6.1深度学习的神经网络中的训练难点

作者: 遇见百分百 | 来源:发表于2018-05-26 15:16 被阅读0次

6.1深度学习的神经网络中的训练难点
神经网络和深度学习笔记（一）
深度学习入门系列，用白话文的方式让你看得懂学的快（第八章）
DeepLearningAI 学习笔记 1.1 深度学习概论
Deep Learning Tutorial 李宏毅（一）深度学
Deep Learning Tutorial
第一章深度学习概论
深度学习之外的人工智能——概率图模型
机器学习之卷积神经网络（二）
吴恩达深度学习笔记（2）-什么是神经网络（Neural Netw

到目前为止, 我们例子中使用的神经网络一共只有3层 (一个隐藏层)：

消失的gradient问题 (vanishing gradient problem)：

>>>importmnist_loader

>>>training_data,validation_data,test_data=mnist_loader.load_data_wrapper()

>>>import network2

>>>net = network2.Network([784,30,10])

>>>net.SGD(training_data,30,10,0.1,lmbda=5.0,...evaluation_data=validation_data,monitor_evaluation_accuracy=True)

结果: 96.48%

加入一个隐藏层：

>>>net=network2.Network([784,30,30,10])

>>>net.SGD(training_data,30,10,0.1,lmbda=5.0,...evaluation_data=validation_data,monitor_evaluation_accuracy=True)

结果: 96.9%

再加入一个隐藏层:

>>>net=network2.Network([784,30,30,30,10])

>>>net.SGD(training_data,30,10,0.1,lmbda=5.0,...evaluation_data=validation_data,monitor_evaluation_accuracy=True)

结果: 96.57%

为什么加入一层反而降低了准确率？

条形区域长度代表∂C/∂b，Cost对于bias的变化率：

随机初始化, 看到第一层学习的速率远远低于第二层学习的速率

进一步通过计算来验证：

另外一个例子:

[784,30,30,30,10]

再增加一层:

[784,30,30,30,30,10]

可以看出, 第一个隐藏层比第四个几乎要慢100倍

这种现象普遍存在于神经网络之中, 叫做: vanishing gradient problem

另外一种情况是内层的梯度被外层大很多, 叫做exploding gradient problem

所以说神经网络算法用gradient之类的算法学习存在不稳定性

训练深度神经网络, 需要解决vanishing gradient problem

造成vanishing gradient problem的原因:

假设每层只有一个神经元

函数最高点σ′(0) = 1/4

按照平时随机从正太分部(0,1)中随机产生权重的方法，大部分|w| < 1

相关文章

6.1深度学习的神经网络中的训练难点
到目前为止, 我们例子中使用的神经网络一共只有3层 (一个隐藏层)：消失的gradient问题 (vanishi...
神经网络和深度学习笔记（一）
1.1 什么是神经网络（Neural Network）？所谓“深度学习”指的是训练神经网络。一个神经网络中的重...
深度学习入门系列，用白话文的方式让你看得懂学的快（第八章）
8.1 BP神经网络极简史在神经网络（甚至深度学习）参数训练中，BP(Back Propagation)...
DeepLearningAI 学习笔记 1.1 深度学习概论
1.1 深度学习概论视频：第一周深度学习概论整理：飞龙什么是神经网络？ “深度学习”指的是训练神经网络，有...
Deep Learning Tutorial 李宏毅（一）深度学
大纲深度学习介绍深度学习训练的技巧神经网络的变体展望深度学习介绍深度学习介绍深度学习属于机器学习的一...
Deep Learning Tutorial
大纲深度学习介绍深度学习训练的技巧神经网络的变体展望 Lecture I：概论 1.介绍深度学习深度学习...
第一章深度学习概论
1.什么是深度学习深度学习是训练神经网络的一种方法，可以训练很深的神经网络，属于机器学习分支。 2.什么是神经网...
深度学习之外的人工智能——概率图模型
神经网络是理解深度表征的模型，深度学习是训练深度神经网络的算法，两者是一脉相承的关系。本质上讲，神经网络和...
机器学习之卷积神经网络（二）
今天继续分享卷积神经网络，常常用深度学习这个术语来指训练神经网络的过程，有时它指的是特别大规模的神经网络训练。那么...
吴恩达深度学习笔记（2）-什么是神经网络（Neural Netw
什么是神经网络？(What is a Neural Network) 我们常常用深度学习这个术语来指训练神经网络的...

网友评论

本文标题：6.1深度学习的神经网络中的训练难点

本文链接：https://www.haomeiwen.com/subject/pntmjftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|6.1深度学习的神经网络中的训练难点|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！