最近,DARPA谈了谈他们怎么看人工智能。DARPA是谁?呵呵。
DARPA是美国国防部属下的一个行政机构,负责研发用于军事用途的<u>高新科技</u>。可能大家看到“高新科技”这类的字眼都已经麻木了,这里要强调的是,人家DARPA研究的是货真价实的高新科技,很多我们知道或者不知道的黑科技,都出自DARPA之手:互联网、Google Maps、Siri、Windows、Unix、GPS、隐形飞机、人脑控制的机器、阿凡达、飞天坦克、人脑芯片、等等等等。总之他们的工作就是<u>redefine impossible</u>。
DARPA's Falcon Project他们认为人工智能分为三个阶段(目前我们显然在第二个阶段):
Handcrafted Knowledge
这一阶段我们只是把某一领域的专业知识、按电脑可以理解的规则输入,电脑从这些固定的规则里推导出我们想要的结果(比如港口物流、国际象棋、报税表等)。这个阶段的人工智能只能应用在一个很窄的领域,它们并没有真正的学习能力、也不能很好的解决未知的问题。
Statistical Learning
我们现在是人工智能第二阶段,和之前最大的区别是它们开始用概率的眼光看待问题。人工智能通过处理大量信息/数据来确定每个选择的概率、以帮助它们完成最终的目标。科学家在不同的领域构造不同的统计模型、接着用特定的数据来训练每个模型。这个阶段的人工智能都是通过神经网络来完成的。
而神经网络的本质,就是研究如何拉伸、扭曲空间,最终将不同的数据集分割开。以下图为例:
神经网络通过拉伸、扭曲两条线所在的平面空间,最终将图中的两条线分开:
所以在我们所处的第二阶段,人工智能理解数据的本质,就是如何分割数据。
下面我们看个例子:MNIST是机器学习的入门数据集,内容是手写的数字0到9,用Google的机器学习平台TensorFlow对它进行学习之后,我们可以看到绝大部分数字被正确的划分到了一起。
同时也可以看到,在分割数据的时候,人工智能并不关心为什么(why)、它们只关心如何(how)。所以它们能很好的感知现实世界、也能够根据新的数据来学习和适应新的环境;只不过它们并没有能力思考数据背后的逻辑,所以也无法将问题抽象、并用来解决其他问题。
由于第二阶段的人工智能优化的是正确判断的概率,具体到个案的时候未必准确。比如上边MNIST数据里,大部分数字都是对的,但写的不清楚的6和7被分别归在了0和1里。加上所谓garbage in、garbage out,有偏差的原始数据也会训练出有偏差的模型。2016年微软就得到了深刻的领悟:人工智能在 Twitter 一天学会骂脏话和种族歧视。
Contextual Adaptation
在未来,人工智能会再深入一层,它们将尝试理解事物的本质、深入理解现实世界。
比如一张猫的照片,人工智能不但能认出是猫、还能说出它为什么是猫(比如有毛、有爪、胖、等等)。这样也极大的方便了我们:
- 我们将需要很少的数据,就可以训练出相对准确的模型。
- 在人工智能出错的情况下,我们也可以清楚看到具体是哪一个环节判断出了问题(对比现在,我们纠错的难度很大,因为神经网络多多少少是个black box)。
在这个阶段,人工智能将会学习构建带语境的模型,然后用这个模型来感知世界,判断事件背后的原因以帮助它自己做决定,甚至把问题抽象出来去处理新的数据。
人工智能发展真的太快了,很难想象TensorFlow是Google去年才发布的平台,在指数级发展的速度下,我们自己应该如何适应?
网友评论