Deep Learning的红火应该说已经有很长一段时间了,随着Google,微软,Facebook等重量级玩家的进入,这一块儿领域的成果/成绩再近几年更加具有轰动效应,尤其是阿尔法go的横空出世,可以说把Machine learning和AI这两个专业领域研究的问题,直接推到了大众的面前。
然而另一面的实事是,对于图像图像,声音识别等领域,深度学习已经有了大量的应用范例和应用手段。但对于很多别的业务领域(金融方向里面的存贷款和客户需求的冲突管理,通信领域的资源分配和优化,信道估计的策略,云/边缘计算里面的network slicing):其是否适用(why),使用哪一个模型(what),以及怎么使用(how)始终是很困扰我的一件事。于是,在众多推荐之下,本着“知奇然知其所以然”的出发点,我开始了这一趟旅程:
先来说说本书的结构:
数学相关知识(偏微分,求导,乘和加的几何意义,矩阵运算(点和叉乘)) +
python针对深度学习的lib+相关用法(numpy, matplotlib)
对于深度学习理论的实践化解释(逼近原则,模型的泛化能力,依靠对于损失的观察确定学习的方向正确性等)
在我心目中一本适合自学的书,需要有这么几个特点:对于细节的讲解要点到要害,对于整体架构/宏观层面的讲解,要能尽量做到清晰。可以说本书对于基础的讲解时非常细致而独到的,颇有自学教材的风范。
具体来说,这本书对于讲解的叙述上,使用一个贯穿全书的“手写文字识别”作为待解的问题,把一个深度学习网络需要注意的各个细节问题都做了准确详尽的讲解。
比如,对于网络的讲解(从感知机 --> 神经网络-->引入相关建模方法(激活函数,loss function等) -->引入卷积层 --> 引入深度加深的概念);对于python的相关知识讲解(numpy和list区别,*和numpy.dot()运算,T,广播方法,python的类型判断方法,im2col对于卷积运算的效率提升);对于数学知识的介绍(解析解和数值解,特征的应用,图形中像素点的灰度信息值得含义和转换)。都有相关性很强的讲解,可以说,如果单独进行,可能理解并不深刻。针对具体的一个一个拆分的问题,加入对于某个数学的,python的和机器学习相关理论的讲解,深入浅出,记忆点建立的比较深刻。
总的来说,对于其他行业的人,想使用machine learning/deep learning作为工具,来为自己的行业带来一些进化/优化的方法的话,我的体会是本书非常适合作为第一本入门读物(这里有个小插曲:关于“鱼书”和“花书”的适用群体。相比之下,花书更适合已经具备一些实践经验的人去阅读)
最够想说点自己对于深度学习这件事的一些随想。
通过这些天的学习,阅读,python practice,以及和相关人士的一些交流。我的直观感受还是很受冲击的。在神经网络这一块儿:
一方面来说,有些很确定对于行业也有直观好处的结果/成绩:比如物体识别(归类问题),语音识别处理,文字识别等等,这一点大家都有自己的体会。我相信对于归类问题,比如应用的行业的decision mode,怎么做更合理,将来一定会有更多更漂亮的案例。我自己也计划对这一块儿做一些实践。
另一方面,主要是针对unsupervised training,到底可以孵化出什么样的’怪兽‘,尤其是现在分布式计算(比如Tensor-flow对于分布式已经做了周全的考虑),Nv 新GPU的 CUDA的性能越来越强。以后的“风格矩阵”也许就不仅仅用在图画这件事了。到底人的优势在何时会被“sensor不如碳基生物,但计算速度有碾压性优势”的computing device超越,可能真的是一个不得不思考和应对的课题。
长路漫漫,对我来说,这是一个非常有趣的启程。
网友评论