美文网首页
周志华《机器学习》之六:神经网络

周志华《机器学习》之六:神经网络

作者: 多多乐 | 来源:发表于2017-05-16 11:01 被阅读0次

神经元模型

单一神经元的模型通常是一个阶跃函数或sigmoid函数,像是模拟神经元输入累积超过一定阈值才给一个输出。

感知机与多层网络

感知机就是两个输入给出一个输出的基础模型,再复杂的神经网络都是多个感知机叠加而成的。感知机可以根据训练误差,调整权重。

误差逆传播

误差逆传播就是BP算法,是神经网络训练的常用算法。标准BP算法和累积BP算法基本对应于随机梯度下降(参数更新只针对单个样本,参数更新频繁)和批量梯度下降(参数更新考虑所有样本)。

BP算法避免过拟合的策略包括“早停”和“正则化”。“早停”在每次训练完都要用验证集估计误差,当训练误差下降但验证误差升高时停止训练。“正则化”在误差函数中加入描述网络复杂度的部分。

全局最小与局部最小

这一部分内容对其他模型也都适用。梯度下降算法趋向于梯度为零的位置,但有可能是一个局部最小值,而非全局最小。常用的跳出局部最小的方法有:

多组不同参数值初始化多个神经网络,相当于从不同初始点开始梯度下降,有可能陷入不同的局部最小,再从中选择更接近全局最小的结果;

模拟退火,类似金属冷却中的原子,一开始都是随机运动的,但慢慢趋于稳定。在当前问题中,即在梯度下降的每一步中都以一定概率接受比当前解更差的结果,从而有助于跳出局部最小。

随机梯度下降。因为每次更新只考虑一个样本,那么单一样本的随机误差其实也有助于跳出局部最小。

相关文章

  • 周志华《机器学习》之六:神经网络

    神经元模型 单一神经元的模型通常是一个阶跃函数或sigmoid函数,像是模拟神经元输入累积超过一定阈值才给一个输出...

  • 机器学习笔记1一概念和基本术语

    在公司实习,按照公司要求开始学习有关机器学习和神经网络的知识,在此做些笔记。 参考教材:周志华机器学习,吴恩达教程...

  • 3.1.1.3 神经网络

    神经网络 原理 《机器学习》周志华 5.1 神经元模型 神经网络中最0基本的成分是神经元(neuron)模型。 M...

  • 3.1.1.4 概率图模型

    神经网络 原理 《机器学习》周志华 14.1 隐马尔可夫模型 机器学习最重要的任务,是根据一些已观察到的证据(例如...

  • 机器学习-周志华 神经网络

    网络可以表达复杂的模型,是简单模型的嵌套。简单模型进行计算,输出需要经过转化,来决定此神经元是否被激活,计算到此的...

  • [机器学习(周志华)]神经网络总结

    这是关于周志华的《机器学习》这本书中关于神经网络的BP算法的证明与部分总结,用来给自己留个记录。 神经网络的原理是...

  • 2.machine_learning_concepts

    1 机器学习概述-from周志华《机器学习》 1.1 机器学习基本概念 机器学习是目前信息技术中最激动人心的方向之...

  • 机器学习(5)

    本章节是对我学习完机器学习(周志华)第五章 所做出来的总结。 第五章 神经网络 5.1 神经元模型 神经网络是由具...

  • 周志华《机器学习》笔记-神经网络

    这是我看西瓜书时做的笔记,由于公式很多并且简书不支持LaTeX公式,所以只能传PDF截图了,可以在这里获得完整PDF。

  • 《机器学习_周志华》PDF高清完整版-免费下载

    《机器学习_周志华》PDF高清完整版-免费下载 《机器学习_周志华》PDF高清完整版-免费下载 下载地址:网盘下载...

网友评论

      本文标题:周志华《机器学习》之六:神经网络

      本文链接:https://www.haomeiwen.com/subject/yjzztxtx.html