反向传播算法的矩阵维度分析

反向传播算法的矩阵维度分析

作者: 云时之间 | 来源:发表于2017-09-23 21:24 被阅读579次

反向传播算法的矩阵维度分析
神经网络之反向传播（BP）算法代码实现
手推CNN，DNN算法流程和反向传播
TensorFlow系列专题（五）：BP算法原理
神经网络的反向传播算法
task1
神经网络之反向传播算法（BP）详细公式推导
反向传播算法之要点(Backpropagation)
2反向传播
BP算法

各位小伙伴们大家好,这几天我在群里看见了一位小伙伴提出了关于BP神经网络的反向传播算法的梯度维度的问题,我对这个问题也很有兴趣,所以希望通过这篇文章来去和大家探讨下这方面的知识.

在我们学习神经网络的时候,我们为了不断地迭代更新目标函数,我们总是不断地往复更新迭代神经网络中的各个参数和权值,而在实际过程中我们一般都是使用的矩阵向量化的方式去计算量化,但是如果我们能够了解这个矩阵求导的过程的话,我们对于反向传播算法中的梯度问题应该就能够很好的理解.(很多有疑惑的伙伴应该是看过CS231n吧,我记得没有读懂他的那个反向传播算法梯度的代码).

神经网络前向传播:

在这里因为上边也提到了,我们都是用的矩阵向量来去表示数据,这里的话每一个变量都是有自己的一个维度的信息的:

神经网络的反向传播:

在使用反向传播去更新参数的时候,一般情况下都需要涉及到参数梯度的求解,那么根据上边的神经网络前向传播公式得到,我们求解的变量的话这时候有dw,dx,db.

现在我们不妨设损失函数loss()=L,并且这个损失函数是一个标量(因为标量对于矩阵的求偏导数的话,矩阵的维度不会发生变化).那这时候我们挨个来,求求dx,dw,db的梯度:

1:dx的梯度:

在这里我们要用到链式求导法则,如果有不熟悉的小伙伴请去:

http://61.139.105.132/gdsx/dzja/7/4.htm

回忆下知识再来看这篇文章,效果更好.

根据链式求导法则,dx的梯度可以表达为:

由神经网络的前向传播中我们知道,每一个变量的维度都是一致的,这时候dx,dw,db的维度分别和x,w,b的维度都是一致的,那么这时候我们就可以得到这样的条件:

那这时候&y/&x的导数就需要计算下了,这个时候我们就需要矩阵的乘法运算来去计算分析:

1:由上文得,dx的维度是N*D,&L/&y的维度是N*M,那个根据矩阵运算公式,我们可以计算出

那么这时候我们可以得到&y/&x的矩阵维度是M*D,那么这时候我们回头看一看前边的条件,W的矩阵维度是D*M,那么&y/&x的矩阵维度岂不是W矩阵的转置?其实就是这样.

我们最后得出一个结论:&y/&x的结果是矩阵w的转置,然后得到以下公式:

那这个时候我们再去求dw,db就会变得非常的toy了,因为思路是相同的:

dw的公式表示为:

再去计算一下:

dw的维度信息如下:

我们这时候可以发现&y/&w的维度是D*N,而x的维度是N*D,这时候其实&y/&w可以看作为一个X的转置,这样的话可以表示为:

那db也就可以更快的推出来了:

链式求导为:

再来个矩阵乘法:

得到:

另外这里有几篇比较好的文章推荐给大家:

http://cs231n.github.io/optimization-2/

http://blog.csdn.net/han_xiaoyang/article/details/50321873

https://zhuanlan.zhihu.com/p/25496760

希望大家可以能够有所收获,也请各位多多指教

相关文章

反向传播算法的矩阵维度分析
各位小伙伴们大家好,这几天我在群里看见了一位小伙伴提出了关于BP神经网络的反向传播算法的梯度维度的问题,我对这个问...
神经网络之反向传播（BP）算法代码实现
反向传播算法实战本次的反向传播算法是基于上篇文章神经网络之反向传播算法（BP）详细公式推导实现的，如果对反向传播...
手推CNN，DNN算法流程和反向传播
DNN 反向传播 DNN算法流程卷积层反向传播池化层反向传播 C NN算法流程
TensorFlow系列专题（五）：BP算法原理
一．反向传播算法反向传播算法[1]（Backpropagation Algorithm，简称BP算法）是深度学习...
神经网络的反向传播算法
1. 前言本文为学习反向传播算法时的总结。 2. 反向传播算法 2.1 示例及初始数据举例说明反向传播算法的计...
task1
线性回归反向传播算法什么叫反向传播，有没有直观理解？如何直观地解释 backpropagation 算法？ ...
神经网络之反向传播算法（BP）详细公式推导
反向传播算法详细推导反向传播（英语：Backpropagation，缩写为BP）是“误差反向传播”的简称，是一种...
反向传播算法之要点(Backpropagation)
反向传播算法之要点(Backpropagation Algorithm) Introduction 反向传播是一个...
2反向传播
正向传播算法要初始化赋值，反向传播算法更新权重w。参考文档：一文弄懂神经网络中的反向传播法
BP算法
BP算法：误差反向传播算法。通过比较输出值与标记值，将误差反向由输出层向输入层传播，利用梯度下降算法进行参数调整。...

网友评论

本文标题：反向传播算法的矩阵维度分析

本文链接：https://www.haomeiwen.com/subject/lwkhextx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

互联网科技

Python语言与信息数据获取和机器学习

热点阅读

机器学习

互联网科技

程序员

Python语言与信息数据获取和机器学习

关于我们|服务条款|联系我们|反向传播算法的矩阵维度分析|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！