深度学习过程反向传播有关sigmoid的求导

作者: 在做算法的巨巨 | 来源:发表于2018-11-07 18:13 被阅读0次

深度学习过程反向传播有关sigmoid的求导
2019-03-18机器学习——梯度消失和爆炸
反向传播求导
Pytorch学习笔记三——自动求梯度
Sigmoid函数求导过程
TensorFlow系列专题（五）：BP算法原理
神经网络
我的数据科学之路-用pytorch做深度学习
DNN 和 CNN的反向传播
深度学习 - 前向传播和反向传播

在深度学习的反向传播过程中，我们需要对激活函数进行求偏导，这里写一点如果激活函数是sigmoid函数时的推导过程。

Flow chart(Forward propagation)

input --> $w_i$ --> $h_i$ --> $y_i=sigmoid(h_i)$ --> Error= $\frac{1}{m}\sum^{m}_{i=1}(y_i-t_i)^2$

Flow chart(Backward propagation)

output <-- $w_i$ <--------------------------- $\frac{\delta Error}{\delta w}$

在经历一次前向传播后，我们会得到一个输出yi，同时我们回得到一个MSE作为与我们目标的误差反馈。深度学习中我们会对误差进行w的偏导，然后对w进行更新，这个步骤和梯度下降法的参数更新是一个原理。

$\frac{\delta Error}{\delta w_i} = \frac{\delta Error}{\delta y_i} * \frac{\delta y_i}{\delta h_i} * \frac{\delta h_i}{\delta w}$

其中，

$\frac{\delta Error}{\delta y_i} = \frac{2}{m}(y_i - t_i)$

$\frac{\delta y_i}{\delta h_i} = \frac{\delta (\frac{1}{1+e^{-h_i}})}{\delta h_i} = \frac{e^{-h_i}}{(1+e^{-h_i})^2} = \frac{1+e^{-h_i}-1}{(1+e^{-h_i})^2} = \frac{1}{1+e^{-h_i}} - \frac{1}{(1+e^{-h_i})^2}$

这里， $y_i = sigmoid(h_i) = \frac{1}{1+e^{-h_i}}$

所以， $\frac{\delta y_i}{\delta h_i} = y_i - y_{i}^{2} = y_i(1-y_i)$

又 $h_i = b+\sum_{i=1}^{m}w_i*x_i$
$\frac{\delta h_i}{\delta w} = x_i$

综上， $\frac{\delta Error}{\delta w_i} = \frac{2}{m}(y_i - t_i)*y_i(1-y_i)*x_i$

最后更新 $w_i$ , $w_i = w_i - \alpha \frac{\delta Error}{\delta w_i}$ , $\alpha$ 是学习率。

深度学习过程反向传播有关sigmoid的求导
在深度学习的反向传播过程中，我们需要对激活函数进行求偏导，这里写一点如果激活函数是sigmoid函数时的推导过程。...
2019-03-18机器学习——梯度消失和爆炸
反向传播的迭代公式为其中f是激活函数，常用sigmoid激活函数求导为导数值域都小于1，误差经过每一层传递都会...
反向传播求导
(教材)其中*表示逐元素乘积向量化后: (自己推导)ReLU: Sigmoid: Affine: LogCost:
Pytorch学习笔记三——自动求梯度
PyTorch提供的autograd包能够根据输入和前向传播过程自动构建计算图，并执行反向传播（链式求导）。 to...
Sigmoid函数求导过程
回顾原由：在推荐系统中，排序阶段会用到逻辑回归，那自然要在温习下Sigmoid函数求导过程。 Sigmoid函数：...
TensorFlow系列专题（五）：BP算法原理
一．反向传播算法反向传播算法[1]（Backpropagation Algorithm，简称BP算法）是深度学习...
神经网络
神经网络的正向&&反向传播通过正向传播后得到的误差来进行反向传播，反向传播时通过求导的方式更新权值，获得误差更小...
我的数据科学之路-用pytorch做深度学习
上一篇文章介绍了深度学习的基本原理，核心过程就是正向传播与反向传播，正向传播由输入到输出，完成一次预测，反向传...
DNN 和 CNN的反向传播
DNN的反向传播在学习CNN的反向传播之前，先学习一个DNN（普通的全连接层的深度神经网络）的反向传播。 DNN...
深度学习 - 前向传播和反向传播
英文原文深度学习---反向传播的具体案例BP（反向传播算法）公式推导及例题解析前向传播 input ->输入到-...