美文网首页算法世界互联网科技
达观数据CEO:划分人工智能水平的四个等级

达观数据CEO:划分人工智能水平的四个等级

作者: 达观数据 | 来源:发表于2017-07-26 19:28 被阅读17次

    人工智能(Artificial Intelligence,简称AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。既然是期望让计算机智能系统来代替人的脑力劳动,自动化的从事的各项工作,那么衡量人工智能的实际水平就非常的重要。

    无论是人工智能还是人类的脑力活动,所要面对的问题的难易程度各不相同,针对不同的应用场景,现在业界所掌握的人工智能技术的实际应用水平高低也各不相同。在选择划分人工智能水平的标准上,国际著名的人工智能专家Sandeep Rajani教授,在文章《人工智能:人或机器》(Artificial Intelligence-Man or Machine)中,通过将人工智能的水平和人类能力进行横向对比后予以划分,定义为共四个等级的水平:

    巅峰级——已经实现了无法超越的最优能力

    超越人类级——比所有人类的能力都要强

    强人类级——比大多数人类的能力要强

    弱人类级——比大多数人类的能力要弱

    在介绍计算机算法和数据挖掘技术的教科书《智能Web算法》(第二版)中,达观数据陈运文将Rajani教授的该四类人工智能的划分方法作了翻译和介绍。在当今时代背景下,现有各个不同应用领域里人工智能技术的水平高低情况和已经达成的水平如下:

    巅峰级水平

    在一些规则完备、策略空间较小的应用场景下,例如在19*19的棋盘里下五子棋,如今的计算机技术已经可以穷举所有可能的对弈情况,确保与人类在任意对弈的情况下都可以实现最优的方案。同样在Tic-Tac-Toe(一种简单的井字棋游戏)、跳棋等领域,以及数据统计等工程应用方面计算机已经是巅峰级水平了

    超越人类级

    AlphaGo和柯洁的围棋对战,以及IBM深蓝(DeepBlue)战胜国际象棋冠军卡斯帕罗夫,都展示了在这些复杂的棋类游戏上人工智能已经达到了超越人类级。在一些具体的应用领域,如指纹识别、虹膜识别等领域,技术也已经非常成熟,同样实现了超越人类的能力

    强人类级

    有些智力活动需要深入的领域经验,计算机相比少量的专业人士能力还有差距,但是比大多数普通吃瓜群众的能力要强。例如在德州扑克、桥牌等领域,计算机已经强过大部分普通人类了,在一些专用领域,例如在良好条件的人脸识别(没有不良的遮挡、光照、角度问题)、良好条件的语音识别(没有特殊地域口音、复杂环境噪声)等领域里,花卉植物种类的识别等领域,计算机的能力也已经达到了强人类级了。

    弱人类级

    有很多技能大多数普通人类掌握起来并不难,例如驾驶汽车,但是对计算机系统来说,因为要采集的信号以及分析的数据情况非常复杂,目前还难以达到普通人类的水平,处于弱人类级。常见的还包括写作文章、阅读理解、人类语言翻译等领域。

    上述介绍里,人工智能的水平从弱人类级到巅峰级水平高低不同,影响人工智能实现能力的主要有三个因素,具体包括:

    因素1:规则和评价方法的明确程度

    越是简单明确、并且计算机可以量化评估的问题,通过人工智能来实现的代价越小,例如棋牌类游戏,计算机可以发挥的作用很大。

    但是越是有不确定因素,例如驾驶车辆,驾驶方法和路况变化很多,并没有非常严格而明确的“胜/负”、“好/坏”的驾驶方式,计算机来学习时会有很多不确定因素。另外例如麻将或扑克,有很多随机性因素,甚至有运气成分,处理条件并不严格一致,此时也会给人工智能更好的处理带来挑战(陈运文达观数据)。

    因此,规则越明确、评判好坏的标准越客观的应用,目前人工智能处理的效果越好。

    因素2:特殊情况出现频率的高低

    很多应用问题,在典型场景下的处理和在包含各种特殊异常情况下处理,其难度高低差异非常大。以人脸识别问题为例,在人脸拍摄条件良好、正面的无遮挡情况下,现有机器学习的技术,完成人脸的检测、识别,精度已经非常高了。但是在实际应用时,会遇到相当多异常因素,例如安装的摄像头,由于受到光照、角度等客观因素的影响,加上被拍摄者存在化妆、佩戴饰品、局部遮挡、年龄变化等各种情况,甚至少量情况下还存在被拍摄者试图通过整容或伪装方式,故意干扰计算机的识别过程,这些因素都会非常严重的影响实际使用的效果。

    自动驾驶技术也同样存在大量的问题,例如正常晴好天气,和雨雪等恶劣天气,对解决问题来说难度的差别非常大。各种各样的路况情况,也对自动驾驶的实用化带来很大的挑战。

    现有的大量人工智能应用,在实验室条件下很多已经达到了非常好的成绩,但是在工业化应用中,由于使用条件比实验室环境要复杂和恶劣的多,需要处理各种异常和干扰因素,因此在很多应用的实际水平,还徘徊在强人类级和弱人类级之间。(陈运文达观数据)

    目前人工智能的技术,从实验室走向实际应用,需要克服的问题很多,还有很长的路要走。在实际落地的时候,务实的做法是先限制具体的场景,尽量排除掉不确定性因素,简化问题。例如在自动驾驶应用时,如果限制为固定线路之间、或者封闭道路内的应用,技术难度就会大大简化,此时往往就能从弱人类级往上提升1-2个级别,达到实际可用的程度。在文字阅读理解时,如果限制文本的行业、类型和理解内容时,也能大大的提升系统的准确率,达到可以实用化的地步。

    因素3:积累的训练数据的规模

    我们都知道,“大数据+算法模型=人工智能”,因此不难看出,人工智能的关键性的基础是大数据。俗话说,巧妇难为无米之炊,只有积累了海量的训练数据,才能将人工智能的水平向上提升。AlphaGo也是通过积累了数千万盘围棋对战棋谱数据,并进行充分的模型训练后,才打败了人类顶尖选手的。

    在每一个人工智能的应用场景里,数据积累程度的高低,直接影响该领域里人工智能的应用水平。然而现实领域里,很多训练数据的积累工作才刚刚开始。尤其是监督式学习所需要的“标注数据(Labeled Data)”的积累,往往需要大量的人工参与,成本很高,大大制约了在各自领域里水平的提升。另外有一些领域的数据因为受到一些政策因素的限制,例如医疗数据,或者有些数据被部分行业企业垄断,难以流通,导致使用时障碍重重。

    随着近年来计算机硬件存储成本的迅速降低,云计算的逐步普及,数据积累工作的硬件环境迅速改善。数据采集的意识也逐步觉醒,希望在应用需求的推动下,有越来越多的数据被数字化,并记录下来,训练出优秀的算法模型来提升效果。

    从弱人类级起步,到强人类级、超越人类级、巅峰级,任重道远,先易后难、化繁为简,随着技术一点一滴的进步,相信未来有越来越多的应用领域里,人工智能技术都能代替人类来完成越来越多有价值的工作。

    申请试用达观产品:https://data.datagrand.com/signup/#/experience?source=online

    关注达观数据公众号,获取更多干货知识。

    达观数据公众号

    相关文章

      网友评论

        本文标题:达观数据CEO:划分人工智能水平的四个等级

        本文链接:https://www.haomeiwen.com/subject/kdmokxtx.html