神经网络与深度学习的读后感

作者: 张少博 | 来源:发表于2017-11-18 08:18 被阅读0次

深度学习之神经元
深度学习手册
《神经网络与深度学习.pdf》PDF高清完整版-免费下载
深度学习笔记之循环神经网络RNN学习笔记
TensorFlow技术解析与实战(读书笔记).md
机器学习入门
深度学习
TensorFlow 深度学习中文第二版（初稿）
BP神经网络的梳理
《Python神经网络》5——机器学习简介

神经网络是基于对机器对于人脑的研究，使机器学习技术正在走进数据中心，它既能改善内部IT管理，还能使关键业务流程更加智能化。你可能已经听说过深度学习的神秘性了，它涉及到一切领域，从系统管理到自动驾驶汽车。到底深度学习是一个刚刚在世人面前揭开面纱的非常聪明的新兴人工智能，还是仅仅一种营销宣传手段，将已有的复杂机器学习算法重新包装成为新的卖点?

　　深度学习无疑激发了大众的想象力，但它其实并不那么复杂。在技术层面上，深度学习主要指大规模运行的大型计算密集型神经网络。这些神经网络往往是由难以用基于逻辑和规则的机器学习方法进行处理的大数据集训练而成，如图像、语音、视频和其他内在具有复杂模式的密集数据。

　　神经网络本身并不新。几乎从现代计算机开创阶段起，神经网络算法已经被研究用于复杂数据流中辅助识别隐藏的内在模式。在这个意义上，深度学习是建立在众所周知的机器学习技术上的。然而，当新兴计算复杂度更高的神经网络算法与如今的大数据集合应用到一起，创造出了重大的新机遇。使用低成本的云服务或商业scale-out大数据结构，可以创建这些"深度"模型，并实时应用于大规模应用场景中。

　　敏感的神经网络

　　神经网络研究起步于上世纪50年代和60年代，最早是为研究人类大脑如何工作而建模出来的。神经网络由多层节点组成，这些节点相互连接组成一张大网，有如大脑中的神经元。每个节点接收输入信号，接下来，它通过一个预先定义好的"激活功能"发出一个输出信号，并传给其他节点，同时确定什么时候节点应该进入活跃状态。简单的，你可以认为节点如何工作取决于其兴奋程度，当一个节点收到一组输入后变得兴奋时，它可以产生一定程度的输出信号，并传递给它的下游节点。有趣的是，一个节点兴奋起来后，它的输出信号可以是正也可以是负;一些节点激活后实际上会抑制另一些节点的兴奋。

　　节点通过链接互连，每个链接有其自己的权重变量。一个链接的权重会调整经过它传输的信号。神经网络通过逐渐调整其整个网络的链接权重，适应和学习如何识别模式，最终只有被正确识别的模式会产生一个完整的遍布全网络的兴奋传递。

　　一般情况下，输入数据被格式化为一个输入信号，链接到第一层外部节点。这些节点随后向一个或多个隐藏层发送信号，最后输出层节点发出一个"反馈"给外部世界。由于学习(也即智能)是隐含在链路权重中的，实际应用的核心问题是搞清楚怎么调节或训练所有的链路权重以实现正确模式的应答。今天，神经网络主要通过后向传播的增量学习技术，用在训练数据中寻找正确的模式来完成学习过程。当神经网络生成一种有用的方式识别出正确的样本时，该方法相应的给予链路"奖励"，当神经网络识别出错误的样本时，则给予惩罚。

　　然而，不可能存在一个能够适用于任何给定问题的神经网络架构。此时机器学习专业知识就是非常重要的了，因为给定一定数量的节点、其激励功能、一定数量的隐藏层以及所有节点的连接关系(例如是密集连接还是稀疏连接，是否存在内部反馈或循环环路)，可能存在无数种潜在的神经网络配置方式。传统研究中，受限于硬件条件，神经网络隐藏层的数量设置得很少，即使如此，神经网络已经展现出超过人类的，惊人的和熟练的学习能力。如今，深度学习神经网络可能具有数百层网络，能够完全胜任深度奥妙问题的处理。

　　深度学习实际应用的关键是搞清楚如何在成百上千个并行计算核心上有效地拓展出大型神经网络，然后用巨量大数据集进行高效的训练。过去，这需要远超企业数据中心规模的高性能计算设备HPC来实现。今天，NVIDIA、Mellanox和DataDirect Networks公司正在推出适合一般企业数据中心规模的HPC产品。例如NVIDIA的DGX-1，本质上它是一台设计用于深度学习，集成了8块高端GPU运算卡的超融合超级计算机，令人惊讶的是，它只有4U这么大，显然可以被一般公司所接受。