形象的描述卷积网络(图像识别领域应用)就是:用逻辑模型实现了感觉模型干的事。打个比方就是选衣服以前靠的是“眼光”这种感觉,而现在有种技术直接告诉你每件衣服和你的匹配程度的具体数字,再也不用纠结会买到压箱底的衣服了。
为什么要提到逻辑和感觉呢,因为这两种学习新知识的方式是截然不同的,教会计算机用逻辑计算来实现自动化已经不是什么新鲜事了,但如何让计算机像人一样靠“感觉”模型去判断事物呢?比如识别一张图片里有什么,这里就要用到深度学习的卷积网络了。
人类有两种学习新知识的神经网络模式,一种是逻辑思考类、一种是运动感觉类。
后者是一种脱离逻辑的认知模式,需要身体的各感官器官的配合来完成学习。而这种运动类的知识往往是很难用具体的逻辑去描述的,比如学习语言、乐器、图像识别、气味识别、运动项目等,往往是小孩子在具备逻辑能力之前就能“自然”的学习到的一类知识能力。
运动类知识有一个共通点便是,只看书是掌握不了的,没有谁只通过看书就能学会游泳,必须结合感官器官去不断的刻意练习,10000小时理论也就是从这里来的。
而逻辑思考类知识恰恰相反,一道考卷上的数学题需要很多个公式的组合变化来求解,仅仅背会公式本身是不够的,还需要理解不同公式、知识点之间的关系。几乎所有书本上的理论知识都是需要运用逻辑去理解的,什么是理解呢?理解就是把新知识解构再拼装的过程,举一反三说的就是建立在理解基础上的“学会了”。
而我们人类的物种优越感也是建立在自我意识和自由意志这两种“感觉”上的,正因为难以用逻辑语言去描述和分析人类神经网络的工作模式,所以在科学高度发达和普及的今天,仍然存在着大量的神秘主义,遍布网络的谣言。其中原因恰恰就是人类把自己的“感觉”和事实直接划等号了,而神秘主义和谣言共同具备的特征是符合直觉、简单抽象化的原因,不需要学习大量科学理论知识,就能解释身边现象的一种思维模型,谁又不爱呢?
回到正题,卷积网络做了一件了不起的事,那就是用逻辑运算的方式模拟了人类的视觉。说模拟不太严谨,毕竟卷积网络的图像识别范围还很窄,距离人类的视觉能力还有很长的路要走。但重点是在脑神经科学家们还没搞清楚人类神经网络的运作方式之前,计算机科学家们已经在应用层面实现了近乎人类神经网络的功能了。
网友评论