《深度学习与计算机视觉 算法原理、框架应用与代码实现.pdf》PDF高清完整版-免费下载
下载地址:网盘下载
备用地址:网盘下载
本书全面介绍了深度学习及计算机视觉中基础的知识,并结合常见的应用场景和大量实例,带领读者进入丰富多彩的计算机视觉领域。作为一本“原理+实践”教程,本书在讲解原理的基础上,通过有趣的实例带领读者一步步亲自动手,不断提高动手能力,而不是枯燥和深奥原理的堆砌。
全书共13章,分为2篇。第1篇基础知识,介绍了人工智能发展历程、计算机视觉概要、深度学习和计算机视觉中的基础数学知识、神经网络及其相关的机器学习基础、卷积神经网络及其一些常见结构,最后对前沿的趋势进行了简单探讨。第2篇实例精讲,介绍了Python基础、OpneCV基础、简单的分类神经网络、图像识别、利用Caffe做回归、迁移学习和模型微调、目标检测、度量学习和图像风格迁移等常见的计算机视觉应用场景。本书从第5章开始包含很多有趣和实用的代码示例。从第7章开始的所有实例都基于当前流行的深度学习框架Caffe和MXNet,其中包含作者原创的大量代码和搜集的数据,这些代码和作者训练好的部分模型已分享到本书github页面上供读者自行下载。
本书适合对人工智能、机器学习、深度学习和计算机视觉感兴趣的读者阅读。阅读本书要求读者具备一定的数学基础和基本的编程能力,并需要读者了解Linux的基本使用。
一分钟了解本书精华内容
引言
深度学习和计算机视觉中的基础数学知识
神经网络和机器学习基础
深度卷积神经网络
Python基础
OpenCV基础
Hello World!
简单的图片分类——手写数字识别
利用Caffe做回归
迁移学习和模型微调
目标检测
度量学习
图像风格迁移
作者简介
叶韵
2007年7月毕业于北京大学信息科学技术学院,获学士学位。2011年4月获得了美国亚利桑那州立大学的电气工程博士学位。拥有超过5年的机器学习研发经验。目前在京东专注于深度学习和计算机视觉算法的研发。加入京东前,曾先后在ProPlus Design Solutions硅谷和北京研发中心任职研发经理,负责统计建模和机器学习算法的研发。后加入西门子中国研究院担任研究员,专注于计算影像和计算机视觉的研究。
精彩书评
这本书广泛而翔实地介绍了深度学习的方方面面,并且由浅入深地阐释了经典CNN算法。作者语言风趣、幽默,对于那些对深度学习充满兴趣,想跃跃欲试的入门读者而言,是一本极好的参考读物。
——华远志 NVIDIA(英伟达)公司高级工程师
Codelab是Google工程师文化的重要组成部分,有经验的程序员理论结合实践,将新技术和新工具用实例的方式加以介绍。无论是Noogler还是Senior Googler,面对Google庞杂的内部技术,正是Codelab使大家能够快速无师自通。叶博士的这本“实战”正是机器学习各领域的一个个高质量的Codelab,是作者多年来摸索积累的第一手经验的总结。对于善于学习推广的程序员,一定可以在学习Deep Learning的路上发现此书大有助益,事半功倍。
——吕佳楠 Google 公司软件工程师
本书对时下热门的深度学习技术从多个视角进行了细致剖析。从深度学习理论在AI领域的进化史,到深度学习理论的数学基础,再到利用工具快速构建深度学习模型,书中都有深入浅出的讲解。书中描述了深度学习技术在计算机视觉各个领域的新应用,内容全面而丰富,示例通俗易懂,是一本带领工程人员深入理解深度学习技术的实用宝典。
——钟诚 博士,理光软件研究院研究员
目录
序言
前言
第1篇 基础知识
第1章 引言 2
1.1 人工智能的新焦点——深度学习 2
1.1.1 人工智能——神话传说到影视漫画 2
1.1.2 人工智能的诞生 3
1.1.3 神经科学的研究 4
1.1.4 人工神经网络的兴起 5
1.1.5 神经网络的第一次寒冬 6
1.1.6 神经网络的第一次复兴 8
1.1.7 神经网络的第二次寒冬 9
1.1.8 2006年——深度学习的起点 10
1.1.9 生活中的深度学习 11
1.1.10 常见深度学习框架简介 12
1.2 给计算机一双眼睛——计算机视觉 14
1.2.1 计算机视觉简史 14
1.2.2 2012年——计算机视觉的新起点 16
1.2.3 计算机视觉的应用 17
1.2.4 常见计算机视觉工具包 19
1.3 基于深度学习的计算机视觉 19
1.3.1 从ImageNet竞赛到AlphaGo战胜李世石——计算机视觉超越人类 19
1.3.2 GPU和并行技术——深度学习和计算视觉发展的加速器 21
1.3.3 基于卷积神经网络的计算机视觉应用 22
第2章 深度学习和计算机视觉中的基础数学知识 27
2.1 线性变换和非线性变换 27
2.2 概率论及相关基础知识 43
2.3 维度的诅咒 50
2.4 卷积 66
2.5 数学优化基础 71
第3章 神经网络和机器学习基础 87
3.1 感知机 87
3.2 神经网络基础 89
3.3 后向传播算法 95
3.4 随机梯度下降和批量梯度下降 104
3.5 数据、训练策略和规范化 108
3.6 监督学习、非监督学习、半监督学习和强化学习 117
第4章 深度卷积神经网络 120
4.1 卷积神经网络 120
4.2 LeNet——第一个卷积神经网络 132
4.3 新起点——AlexNet 133
4.4 更深的网络——GoogLeNet 136
4.5 更深的网络——ResNet 142
第2篇 实例精讲
第5章 Python基础 148
5.1 Python简介 148
5.2 Python基本语法 150
5.3 Python的科学计算包——NumPy 167
5.4 Python的可视化包——matplotlib 175
第6章 OpenCV基础 182
6.1 OpenCV简介 182
6.2 Python-OpenCV基础 184
6.3 用OpenCV实现数据增加小工具 193
6.4 用OpenCV实现物体标注小工具 203
第7章 Hello World! 212
7.1 用MXNet实现一个神经网络 212
7.2 用Caffe实现一个神经网络 219
第8章 最简单的图片分类——手写数字识别 227
8.1 准备数据——MNIST 227
8.2 基于Caffe的实现 228
8.3 基于MXNet的实现 242
第9章 利用Caffe做回归 249
9.1 回归的原理 249
9.2 预测随机噪声的频率 250
第10章 迁移学习和模型微调 264
10.1 吃货必备——通过Python采集美食图片 264
10.2 美食分类模型 271
第11章 目标检测 288
11.1 目标检测算法简介 288
11.2 基于PASCAL VOC数据集训练SSD模型 296
第12章 度量学习 304
12.1 距离和度量学习 304
12.2 用MNIST训练Siamese网络 307
第13章 图像风格迁移 317
13.1 风格迁移算法简介 317
13.2 MXNet中的图像风格迁移例子 320
网友评论