最近看了一篇文章,关于Few-shot Learning的综述,看到作者有第四范式的研究者。这个名字让我联想到了之前帮导师做《机器学习》课程PPT时查阅到的一些资料,整理了一下写在这里。
ps. 如导师所言,干的事儿都不白干,总会有用的。。
范式
- “范式”(paradigm)这一概念最初由美国著名科学哲学家Thomas Samuel Kuhn于1962年在《科学革命的结构》中提出来,指的是常规科学所赖以运作的理论基础和实践规范,是从事某一科学的科学家群体所共同遵从的世界观和行为方式。
- “范式”的基本理论和方法随着科学的发展发生变化,新范式的产生,一方面是由于科学研究范式本身的发展,另一方面则是由于外部环境的推动。
科学范式的提出
图灵奖得主,关系型数据库的鼻祖Jim Gray(吉姆-格雷)在2007年加州山景城召开的NRC-CSTB大会上,发表了生前的最后一次演讲“The Fourth Paradigm: Data-Intensive Scientific Discovery”,提出了科学研究的第四类范式,其中的“数据密集型”就是现在我们熟知的“大数据”。
- 几千年前,是经验科学,主要用来描述自然现象
- 几百年前,是理论科学,使用模型或归纳法进行科学研究
- 几十年前,是计算科学,主要模拟复杂的现象
今天,是数据探索,统一于理论、实验和模拟。它的主要特征是:数据依靠信息设备收集或模拟产生,依靠软件处理,用计算机进行存储,使用专用的数据管理和统计软件进行分析。
第一范式
- Describing natural phenomena,描述记录自然现象,也可理解为实验科学
- 方法以基于实验或经验的归纳为主
- 如:钻木取火,比萨斜塔实验
第二范式——理论科学
- Using models, generalizations,在自然现象基础上进行了抽象简化
- 主要通过构建数学模型进行研究
- 如:相对论,博弈论
第三范式——计算科学
- Simulating complex phenomena,以计算机仿真模拟取代实验
- 如:天气预报、核试验模拟
第四范式——数据探索
- Data captured by instruments or generated by simulator; Processed by software; Information stored in computer; Scientist analyzes database
- 因果关系→相关关系,知道“是什么”有时比知道“为什么”更重要
推荐阅读
Tony Hey, et al., The Fourth Paradigm: Data-Intensive Scientific Discovery, 2009.
《Big Data: A Revolution That Will Transform How We Live, Work, and Think》by Viktor Mayer-Schönberger
第二本书网上有卖,内容写的很好,里面有很多观点很深刻。唉,还是看书少啊。。
网友评论