美文网首页产品@IT·互联网
2016年度AI大赛上,选手和评委擦出了火花

2016年度AI大赛上,选手和评委擦出了火花

作者: 华强智造Hi空间 | 来源:发表于2016-12-29 09:42 被阅读77次

    主持人开场

    不久前,三星陆续收购了Harman、Viv Labs,开始在人工智能领域发力,而成果最终将在下代旗舰Galaxy S8上展现出来,那就是全新的人工智能语音助手“Bixby”。Bixby基于Viv的人工智能引擎,会出现在Galaxy S8的几乎所有预装应用中,实现系统级的整合,全面取代现在的S Voice。

    不过,说起AI,三星可算不上什么老前辈,至少在手机智能助手上,Siri就第一个不服;说起语音识别,讯飞家笑了;如果是下围棋呢,谷歌家的“狗”今天又要来笑傲江湖……

    所以,环视一下四周,今天“2016年度AI大赛”的选手们就不需要一一为大家介绍了。直接进入主题,2016年度AI大赛,正式开始!


    参赛选手

    1号选手:Siri

    尽管在过往,Siri一直被认为是鸡肋般存在,智能程度不高,但在今年6月份的苹果的全球开发者大会(WWDC 2016)上,Siri成为了重头戏。大会展示Siri的更多新功能,比如跨设备,包括iPhone、iPad、Apple TV、Apple Watch,甚至有望首次出现在Mac电脑中。

    一向保守的苹果此次还首次宣布将Siri开放给开发者,通过新的语音交互和接口接入,更新后的Siri可以直接发送微信,语音完成滴滴、Uber的打车应用,同时支持支付宝支付。更加智能化的Siri为用户提供越来越多的便捷服务。

    详细资料:Siri助力苹果发大招,对战亚马逊Echo、Google Home和叮咚

    2号选手:讯飞语音

    只要提及语音识别,讯飞肯定是不会被忘记的一位。事实上,2010年,讯飞语音输入技术的识别率才初步达到使用门槛,字正确率还不到80%;而后随着用户越来越多,积累了大量的数据,通过大数据的训练驱动,识别效果稳步提升,能够到达90%以上;2012-2013年,使用了深度学习算法,再结合大数据的训练,其正确率又有了更大的突破。

    2016年,识别率高达97%的讯飞语音输入法,在锤子手机新品发布会上抢尽主角风头,一夜爆红。

    详细资料:讯飞火爆朋友圈,不只这么简单

    3号选手:阿尔法狗

    阿尔法狗战胜人类围棋冠军李世石,是2016年3月最火爆的消息;阿尔法狗欲在2017年复出再度挑战人类,更让无数人期待。

    阿尔法狗(AlphaGo) 是一款围棋人工智能程序,由位于英国伦敦的 DeepMind(Google 旗下公司)团队历时两年开发而成。DeepMind 团队找到了深度学习(Deep Learning)的终极杀器,利用价值网络(value network)去计算局面,然后再用策略网络(policy network)去选择下子。价值网络和策略网络是两种不同的深度神经网络,共同构成了阿尔法狗的“大脑”。

    围棋过程中,阿尔法狗的大脑可以模拟人脑先筛选出那些有利的棋局,并抛弃掉明显的差棋,从而将计算量控制在其大脑可以完成的范围内。

    详细资料:最近火爆的“阿尔法狗”是什么狗

    4号选手:微软小冰

    在人工智能大爆炸的2016年,微软团队推出第四代小冰,并宣称她已“年满18岁”,到了“发挥社会价值”的时候了。

    微软小冰成年,是来自技术方面的鉴定。成年礼上,小冰展示出了三个特点:

    一是拥有独立三观。能够与人自由对话,甚至可以成为话题的发起者;

    二是全息感知。即使没有一个硬件载体,更谈不上“眼睛”、“鼻子”,“嘴”,但小冰已经能够和人打电话了,在9月17日推出前,小冰据称已经悄悄给12104个人类打过了电话;

    三是“能听会说”。小冰对外展示了“唱歌”方面的能力,除了演唱了湖南卫视的《夏日甜心》主题曲外,还在日本东京电玩展上,推出了第一支日语单曲。

    然而,小冰的存在是没有现实载体的,并不像HBO《西部世界》里的机器人一样做到看上去和人类一样。在大部分人的概念里,微软小冰是一个聊天机器人,但微软一直坚持不让小冰做一个“有用的机器人”,因为只有这样,人们才不会把它当做一个订咖啡、外卖、闹钟的工具,才会认真地跟它聊天,才会产生真正的数据,才能更好地训练以情感计算框架为基础的小冰的情感认知模型。

    详细资料:形与魂:人形机器人+人工智能

    5号特邀选手:神州十一号

    为何神州十一号此次乱入?因为神州十一号飞船2016年升空,除了为见他心爱的天宫二号妹妹外,还有一个和人工智能领域紧密相关的隐秘任务——一项具有科幻色彩的前瞻性研究——由意念控制的脑机交互实验。

    “天宫二号”空间实验室成功发射,将世界首套在轨脑机交互及脑力负荷等测试系统带上太空。此次航天员乘坐神州十一号进驻“天宫二号”空间实验室后,将在未来30天的太空之旅中开启人类史上首次太空脑机交互实验。

    在太空中进行由意念控制的脑机交互实验,无疑是我国人工智能的一大进步,脑机交互更一直被列为美国最优先支持发展的颠覆性创新技术之一。

    详细资料:除了天宫二号,神州十一号的隐密任务


    评委点评

    其实,自1956年达特茅斯会议诞生“人工智能”一词以来,距今已有60年。在这期间,虽然人工智能涉及的不同学科、不同技术发展起起伏伏,但人工智能整体上一直处于不断增长的趋势,并不存在高潮低谷之说。可以说,整个人工智能的发展过程都是在这样的模式之中,不同技术在不同时期扮演着推动人工智能发展的角色。

    评委钢铁侠:AI还不成熟,但我们足够聪明可以把它应用起来

    AI(人工智能)可以分为三个层次,第一个层次叫感知智能、第二个层次叫认知智能、第三个层次叫行为智能。

    (一)感知智能,就是大家现在比较熟悉的,甚至把他当作人工智能全部的,如语音识别、人脸识别、手势识别、红外感应等感知方面的能力,统统属于感知智能。

    感知智能在最近这些年的发展非常快,早期的感知智能,我们只能通过监督学习和非监督学习,通过打标注的方式去实现感知智能,提取其中的一些特征点。随着深度神经网络在感知智能方面的应用,感知智能确实取得了非常大的突破。

    (二)认知智能,感知智能的下一步就叫做认知智能。我们想要一个“大白”,那实际上这个“大白”重要的不仅仅是能够识别你的声音,不仅仅只是能够看到你的图片,最终要的是他需要一个自我认知的情感的系统。

    而怎样实现这样的自我认知的系统,纯粹依靠我们的深度神经网络其实无法做到。因为他的覆盖面要更宽,这就是语义引擎和人交互的能力。这一块就称之为认知智能。在认知只能方面,我们目前是通过NLP,也就是自然语言处理的方式进行。单单用NLP还无法做到认知智能,更需要做的是用深度神经网络和知识图谱的交叉结合来提升我们的认知智能。

    (三)行为智能。举个例子,春节晚会上优必选的500个机器人表演舞蹈就是一种行为智能。但真正让我们惊讶的行为智能,是春晚结束没几天,我们看到的波士顿机器人公司的阿特拉斯(Atlas)机器人,它所表现出力度、平衡度、准确度、控制能力。类似这样的行为智能,在国内发展是比较缓慢的。

    目前,中国已开始转向积极培育人工智能(AI)产业,人工智能形成了空前的热潮。语音和图像识别、自动翻译、自动驾驶汽车……过去在人工智能领域,百度一直受到轻视,被认为只是追随美国谷歌和苹果。但在如今,百度已开始在硅谷等地招聘大量人员,开发能力被认为不逊色于领跑者。

    评委贾维斯:虽然中国选手今天只有讯飞参赛,但我想请观众席上的百度少帅顾嘉唯揭秘人工智能布局

    人工智能分为强人工智能与弱人工智能。许多计算机领域的科学家都对强人工智能提出过质疑,比如“铁钉灭世”的猜想,认为人工智能达到一定的高度之后,机器人最终会将指令的执行带入极端从而想消灭人类。但是百度少帅顾嘉唯认为,现阶段的科学发展还离强人工智能很远,实现弱人工智能依然能够为人类带来无限的方便与可能。但下一步,首先是要解决信息之间的打通和用户行为的预测,进而消除设备与设备之间的摩擦,还原“不插电”的智能生活。

    实现弱人工智能(从底往上)的三个核心是:

    1.感知(Perception):通过多维传感器搜集人的生理信息和环境的物理信息

    2.理解(Understanding):即深度学习(Deep Neural Network + Deep Learning)

    3.决定(Decision):比如推荐服务

    深度学习之所以有很大前景来源于以下几个优势:

    1.具有来自于人脑的运算机制(inspiration by brain)

    2.适合大数据运算(suitable for big data)

    3.端到端的学习体(end-to-end learning)

    4.具有丰富的建模语言(a rich modeling language)

    深度学习如何影响到未来互联网:

    1. 网页的索引知识,搜索,广告,预测

    2. 人的维度:图形,声音(百度的语音技术是自主开发,性能和识别率都非常好)

    3. 实体世界:感知到3D,VR,增强现实。

    百度搜索在这个方面的进步是可以通过语音的输入来筛选出重要的语义,另一个很酷炫的功能是拥有图像搜索的入口并且能够识别图像进行相关信息的推介。另一个有关深度学习的产品是一款叫“脸优”的APP,其技术核心是深度学习的本地化以及在手机端完成实时把2D图片生成3D图片,并且是只有200k的实时3D化渲染。

    评委黑寡妇:你们说了人工智能领域的语音识别技术、深度学习能力、人机交互等方面,我还想说说图像识别技术。毕竟,2016年华为、苹果纷纷抢占图像时代也挺火热的。

    图像作为人类感知世界的视觉基础,是人类获取信息、表达信息和传递信息的重要手段,也是目前正在逐渐兴起的技术,可以帮助人们更客观、准确地认识世界。在图像时代,图像成为重要的表达话语,用图像建构、描摹一个接近真实的景观社会,比文字更有说服力。

    Gartner半导体行业分析师盛陵海指出:“图像处理能力赋予了机器看世界的能力,这是人工智能的重要输入。”事实上,过去,图像处理技术已经被广泛地运用在工业相机、摄像机、扫描仪等设备中。未来,无论是新一代汽车、安防监控、机器人、移动与消费电子、智能建筑还是工业电子与零售,智能图像处理的需求将会进一步爆发。

    正是因为图像处理作为人工智能的输出部分,我们现阶段还处于弱人工智能,一切充满了未知的变数,才吸引了华为的目光。

    评委雷神:看到各位选手表现出来的综合实力,我不得不点赞。那么,人工智能的“奇点”何时临近?

    我前段时间看了欢乐颂,非常关心男主之一“奇点”。“奇(qí)点,大爆炸宇宙论所追溯的宇宙演化的起点。它具有一系列奇异的性质,无限大的物质密度,无限大的压力,无限弯曲的时空等。在奇点处,随着宇宙的诞生,开始有了变化,是宇宙的开始。”

    虽然剧中人物都读作“奇(qí)点”,但目前关于奇点的读音仍存在争议。”奇点“英文原词为singularity/singular point,singular,ji是本义(单独剩出来的),qi是引申义(与众不同的、不合群的),中国大百科全书注音为“qí”。

    想起自己之前读过的一本书——美国Ray Kurzweil 著、机械工业出版社出版的《奇点临近》——也许可以解释出“奇点”中的奥秘。《奇点临近》提供了一个崭新的视角,展示了以人工智能为代表的“奇点”思潮,揭示了其在世界范围内所产生的广泛影响。

    评委美国队长:点赞的同时,也引发了我的担忧,未来人工智能的道德代码应该如何编写?

    随着人工智能从科幻小说逐渐变成大众科学,加上科幻作品一直大肆渲染人工智能对人类生存的威胁,人们其实无不担忧人工智能对工作岗位、运输,甚至战争产生影响。但在科学界,对这一切似乎并没有被看得太悲观。

    9月底,美国的技术巨头——IBM、苹果、Amazon、微软、Facebook 以及 Google 的计算机科学家联合成立了一个新联盟,名字叫做“造福社会与公众的人工智能合作伙伴关系”,该联盟的目标之一就是建立 AI 领域最佳实践的规范标准。虽然尚不清楚具体成果,但他们的基本目标很清楚:确保人工智能研究将造福而非危害人类。

    10月份,百度李彦宏、阿里巴巴马云在大学校园给学生分享了他们的人生经历和对新技术的展望时,也表达了对AI未来的看好。

    尽管AI应用有许多不确定与风险存在,尽管人们总是会对未知的未来充满忧虑甚至恐惧,但科学的道路从来就不平坦。AI是危害或是造福人类,也许就掌握在人类自己手上。只有拿出拥抱未知的勇气,我们才配得上更好的生活。

    评委绿巨人:此外,在各项技术迅速发展的同时,普通消费者是怎么看待人工智能的?

    尽管《终结者》、《机器姬》和《复仇者联盟:奥创时代》等许多电影都描绘了人工智能带来的可怕故事,但一项新的调查认为世界各地的人总体上对人工智能是持乐观态度的,人们认为人工智能将给社会经济和个人生活带来的积极影响比消极影响更多。


    主持人结语

    一场比赛下来,评委的点评似乎比选手还要引人注意。总的来说,不管是语音识别、深度学习还是智能机器人,AI都走在不停进步的路上。尽管也有争议和担忧,更多人对AI仍是抱着期待的态度。

    2017年,AI或将带给人类更多惊喜。

    相关文章

      网友评论

        本文标题:2016年度AI大赛上,选手和评委擦出了火花

        本文链接:https://www.haomeiwen.com/subject/snmuvttx.html