深度度学习的故事三

作者: 21世纪教育家 | 来源:发表于2019-05-21 07:34 被阅读0次

深度度学习的故事三
度
电话基督教额
心灵小故事1
百度春招四道
[编程题] 买帽子
第二章三角学回顾
有度
【百度】度度熊想买一顶价格第三便宜的帽子
度量学习和深度度量

When in doubt, use brute force.

"如果遇到困惑(的问题), 就使用蛮力. "

此话出自当年 UNIX 系统的发明人之一 Ken Thompson. 他的本意是, 程序设计中,简单粗暴的计算方法, 虽然可能计算量大, 但是便于实现和维护, 长期看, 还是优于一些精巧但是复杂的计算手段.

这句话常令我遐想起 1943年七月, 苏联和德国在库尔斯克的坦克大决战. 苏军八千多辆傻大黑粗的T-34 坦克, 以损失三倍于对手的惨重代价, 最终挫败德军三千多辆质量精良的虎式坦克集群.

有哲人对蛮力有另外一个诠释: "Quantity is Quality".

数量就是质量. 向数量要质量.

九十年代, 一个简单的神经网络数据培训的计算, 往往至少要花几天, 甚至几周的时间.

这对于算法的改进调整, 和应用开发, 都是一个巨大的瓶颈.

神经网络的研究, 呼唤着蛮力, 呼唤着来自计算速度,网络速度, 内存容量,数据规模各个方面的, 更强大的, 指数增长的蛮力.

(2)

这个蛮力的基础,其实在1993年就埋下了种子.

黄仁勋, 1963年出生于台湾. 1993年从斯坦福大学硕士毕业后不久,创立了 Nvidia.

Nvidia 起家时,做的是图像处理的芯片,主要面对电脑游戏市场. 1999 年Nvidia推销自己的 Geforce 256 芯片时, 发明了 GPU (Graphics Processing Unit, 图像处理器)这个名词.

GPU 的主要任务, 是要在最短时间内显示上百万,千万甚至更多的像素.这在电脑游戏中是最核心的需求. 这个计算工作的核心特点, 是要同时并行处理海量的数据.

GPU 在芯片层面的设计时, 专门优化系统, 用于处理大规模并行计算.

传统的 CPU (中央处理器) 芯片架构, 关注点不在并行处理, 一次只能同时做一两个加减法运算. 而GPU 在最底层的算术逻辑单元 (ALU, Arithmetic Logic Unit), 是基于所谓的 Single Instruction Multiple Data ( 单指令多数据流)的架构,擅长对于大批量数据并行处理.