吴恩达-机器学习笔记（第五周）

作者: 楠子小先生 | 来源:发表于2019-03-20 09:03 被阅读0次

引言
《吴恩达 - 机器学习》笔记
内容整理（持续更新）
吴恩达-机器学习笔记（第五周）
30行python代码实现最简单的神经网络
5.machine_learning_LR_Softmax
机器学习笔记
吴恩达机器学习课程
机器学习相关资料整理
吴恩达deep_learning_week2_logistic回

九、神经网络的学习(Neural Networks: Learning)

9.1 代价函数

假设神经网络的训练样本有m个，每个包含一组输入x和一组输出信号y，L表示神经网络层数， $S_I$ 表示每层的neuron（神经元）个数， $S_L$ 代表最后一层中处理单元的个数。
将神经网络的分类定义为两种情况：二类分类和多类分类，
二类分类： $S_L=0,y=0 or 1$ 表示哪一类；
K类分类： $S_L=k,y_i=1$ 表示分到第i类；(k>2)

逻辑回归的代价函数为：

在神经网络中，一个K分类问题，我们可以有很多输出K个变量，即

即：

9.3 反向传播算法的直观理解

这篇文章已经介绍的很详细了：
https://blog.csdn.net/li744831579/article/details/81915615

9.4 实现注意：展开参数

本节介绍一个细节——怎样把参数从矩阵展开成向量，以便我们在高级最优化步骤中的使用需要。

9.5 梯度检验

为了避免对复杂模型使用梯度下降算法时出错，而得不到最优解，引入梯度的数值检验（Numerical Gradient Checking）——通过估计梯度值来检验我们计算的导数值是否真的是我们要求的。
估计梯度：在代价函数上，对于某个特定的 θ，我们计算出在 θ-ε 处和 θ+ε 的代价值（ε是一个非常小的值，通常选取 0.001），然后求两个代价的平均，用以估计在 θ 处的代价值。

Octave 中代码：

gradApprox = (J(theta + eps) – J(theta - eps)) / (2*eps)

当θ为向量——检验偏导数。因为代价函数的偏导数检验只针对一个参数的改变进行检验，下面是一个只针对 $θ_1$ 进行检验的示例：
${∂\over∂θ_1}={J(θ_1+ε_1,θ_2,θ_3...θ_n )-J(θ_1-ε_1,θ_2,θ_3...θ_n )\over2ε}$
最后，对通过反向传播方法计算出的偏导数进行检验。
将计算出的偏导数存储在矩阵 $D^{(l)}_{ij}$ 中，将对每个 θ 计算的近似梯度值存在近似梯度矩阵中，比较两个矩阵。注，检验时，我们要将矩阵展开成为向量。