DL概念

作者: 爱吃泡芙的笑笑 | 来源:发表于2017-01-25 16:44 被阅读0次

浅层学习是机器学习的第一次浪潮

20世纪80年代末期,用于人工神经网络的反向传播算法(也叫Back Propagation算法或者BP算法)的发明,给机器学习带来了希望,
这种基于统计的机器学习方法比起过去基于人工规则的系统,在很多方面显出优越性。这个时候的人工神经网络,虽也被称作多层感知机(Multi-layer Perceptron),但实际是种只含有一层隐层节点的浅层模型。

20世纪90年代,各种各样的浅层机器学习模型相继被提出,例如支撑向量机(SVM,Support Vector Machines)、 Boosting、最大熵方法(如LR,Logistic Regression)等。这些模型的结构基本上可以看成带有一层隐层节点(如SVM、Boosting),或没有隐层节点(如LR)。

深度学习是机器学习的第二次浪潮。

Geoffrey Hinton:1)多隐层的人工神经网络具有优异的特征学习能力,学习得到的特征对数据有更本质的刻画,从而有利于可视化或分类;2)深度神经网络在训练上的难度,可以通过“逐层初始化”(layer-wise pre-training)来有效克服,在这篇文章中,逐层初始化是通过无监督学习实现的。

Deep learning本身算是machine learning的一个分支,简单可以理解为neural network的发展。
而为了克服神经网络训练中的问题,DL采用了与神经网络很不同的训练机制。传统神经网络中,采用的是back propagation的方式进行,简单来讲就是采用迭代的算法来训练整个网络,随机设定初值,计算当前网络的输出,然后根据当前输出和label之间的差去改变前面各层的参数,直到收敛(整体是一个梯度下降法)。而deep learning整体上是一个layer-wise的训练机制。这样做的原因是因为,如果采用back propagation的机制,对于一个deep network(7层以上),残差传播到最前面的层已经变得太小,出现所谓的gradient diffusion(梯度扩散)。

BP算法存在的问题:

(1)梯度越来越稀疏:从顶层越往下,误差校正信号越来越小;

(2)收敛到局部最小值:尤其是从远离最优区域开始的时候(随机值初始化会导致这种情况的发生);

(3)一般,我们只能用有标签的数据来训练:但大部分的数据是没标签的,而大脑可以从没有标签的的数据中学习;

2006年,hinton提出了在非监督数据上建立多层神经网络的一个有效方法,简单的说,分为两步,一是每次训练一层网络,二是调优,使原始表示x向上生成的高级表示r和该高级表示r向下生成的x'尽可能一致。方法是:

1)首先逐层构建单层神经元,这样每次都是训练一个单层网络。

2)当所有层训练完后,Hinton使用wake-sleep算法进行调优。

deep learning训练过程具体如下:

1)使用自下上升非监督学习(就是从底层开始,一层一层的往顶层训练):

采用无标定数据(有标定数据也可)分层训练各层参数,这一步可以看作是一个无监督训练过程,是和传统神经网络区别最大的部分(这个过程可以看作是feature learning过程)

2)自顶向下的监督学习(就是通过带标签的数据去训练,误差自顶向下传输,对网络进行微调):

基于第一步得到的各层参数进一步fine-tune整个多层模型的参数,这一步是一个有监督训练过程;第一步类似神经网络的随机初始化初值过程,由于DL的第一步不是随机初始化,而是通过学习输入数据的结构得到的,因而这个初值更接近全局最优,从而能够取得更好的效果;所以deep learning效果好很大程度上归功于第一步的feature learning过程。

Deep Learning Algorithm 的核心思想:

把learning hierarchy 看做一个network,则

①无监督学习用于每一层网络的pre-train;

②每次用无监督学习只训练一层,将其训练结果作为其higher一层的输入;

③用监督学习去调整所有层

相关文章

  • DL概念

    浅层学习是机器学习的第一次浪潮 20世纪80年代末期,用于人工神经网络的反向传播算法(也叫Back Propaga...

  • DL概念

    Precision / Recall / Accuracy 引用 https://en.wikipedia.org...

  • DL概念等

    为什么引入DL? 如:机器学习的瓶颈,随着数据量的增加,ML性能达到上限。故有small NN——middle N...

  • DeepL

    基本概念 https://chenrudan.github.io/blog/2014/06/26/dl1basec...

  • 微信scheme

    "weixin://dl/stickers""weixin://dl/games""weixin://dl/mom...

  • 第三方常用scheme

    微信 "weixin://dl/stickers""weixin://dl/games""weixin://dl/...

  • android studio 3.0下载地址

    https://dl.google.com/dl/android/studio/install/3.0.0.18/...

  • Markdown学习

    Download [Markdown 1.0.1][dl] (18 KB) -- 17 Dec 2004[dl]:...

  • DL4J中文文档/调优与训练/可视化

    内容 用DL4J UI可视化网络训练DL4J UI:概述DL4J UI:模型 DL4J UI与Spark训练 使用...

  • linux

    android studio wgethttps://dl.google.com/dl/android/studi...

网友评论

      本文标题:DL概念

      本文链接:https://www.haomeiwen.com/subject/eybzbttx.html