《电子产品世界》
摘要:2017年1月12日,清华大学计算机系教授邓志东在“科学传播与科技期刊论坛暨刊媒惠年度大会”上,做了《拥抱人工智能的春天》的报告。介绍了四个方面:2016年人工智能迎来了春天,人工智能引起社会的极大关注,人工智能上升为国家发展战略,发展我国人工智能技术与产业的建议。
1 2016年人工智能迎来了春天
2016年人工智能(AI)进入了第三个高潮。2016年3月9~15日,谷歌AlphaGo(阿尔法狗)以4:1的成绩击败世界围棋冠军李世石职业九段,意义非常重大。因为过去机器主要做感知,现在出现了认知,这是人工智能的关键所在。
8个月后,2016年12月29日~2017年1月4日,AlphaGo的升级版——谷歌Master(大师)在30秒快棋网测中,以60胜0负1和的成绩,横扫柯洁、古力、聂卫平、朴廷桓、井山裕太等数十位中日韩世界冠军与顶级高手。从此以后,也许人类以后就没有和Master进行围棋比赛的机会了!除了围棋,人工智能下一步将在国际象棋、中国象棋等棋类方面发展。
扑克牌方面,专家水平的人工智能首次战胜一对一无限注德州扑克人类职业玩家,而且DeepStack让机器拥有知觉。
人工智能还能玩游戏。其意义很重大,平时环境中很难得到一些数据,因为游戏相当于虚拟社会,例如“星际争霸2”是复杂的虚拟社会,如果人工智能在这个虚拟社会中能战胜人,这将是非常了不起的,未来可涉及到高级决策,在军事上很有用处。2016年11月5日,谷歌DeepMind宣布与暴雪合作开发人工智能,挑战实时战略视频游戏“星际争霸2”。这件事情的意义非常重大。下一步可以用于军事上的高级战略决策。
无人驾驶方面,2016年11月15日,“在第三届世界互联网大会”期间,18辆百度“云骁”亮相乌镇子夜路,在3.16公里的开放城区道路上自主行驶。2016年特斯拉Autopilot 2.0问世,该软件只需要八千美元,就可让软件驾驶汽车。所有特斯拉新车将安装“具有完全自动驾驶功能”的该硬件系统,并可通过OTA(空中下载技术)进行软件升级;自动驾驶功能从L2(二级,半无人驾驶)直接跳跃到L4/L5();2017年底之前,特斯拉车将以完全自动驾驶模式从洛杉矶开往纽约。Uber提出在城区大范围无人驾驶出租车试运行,Uber 2016年9月14日在美国匹兹堡市推出城区大范围无人驾驶出租车免费载客服务并试运行,先期已测试近2年,说明无人驾驶真正落地了。
为何无人驾驶很重要?因为人工智能是无人驾驶的核心。除了百度、特斯拉、Uber,谷歌Waymo也在做自动驾驶测试。此外,沃尔沃、福特、宝马、百度、英特尔等全球约20多家企业公开宣布,4年以后的2021年将会是无人驾驶/自动驾驶元年,部分SAE L4车将会实现量产。
*计算机视觉
针对ImageNet ILSVRC测试比赛的1000种物体识别,Deep CNN超过了人类的识别能力。人是5.1%(如图1),2016年2月23日谷歌人工识别的评测是3.08%。ImageNet ILSVRC中有1000种物体,例如猴子、马、飞机、坦克等约1500万张照片、包含2.2万类种不同物体。深度学习一般能做到52层,极深度学习(very deep learning)现在已经做到1000层。
在ILSVRC 2016国际评测中,包括视觉物体检测、视觉物体定位、视频物体检测、场景分类、场景解析等性能均有提高。值得一提的是,在此次大会上,中国团队大放异彩,几乎包揽了各个项目的冠军(图2)。
*人工智能语义分割
基于全卷积神经网络FCN的路面/场景像素级语义分割取得重要进展。为此,我们可以分割大部分道路。
*人工智能唇语专家
看电视时把声音关掉,靠嘴唇说话的变化来识别谈话内容,这种能力机器识别率已经超过人类。例如2016年12月,英国牛津大学与谷歌DeepMind等研发的自动唇读系统LipNet,对GRID语料库实现了95.2%的准确率;对BBC电视节目嘉宾进行唇语解读,准确率为46.8%,远远超过专业的人类唇语专家(仅为12.4%)。
*人工智能人脸识别
人脸识别可以达到产品级别,例如支付宝的刷脸成功率超过了人类。如图3,人的水平为97.46,百度为99.77。因此可以进行产品体验。2017年1月6日,百度人工智能机器人“小度”利用其超强人类识别能力,以3:2险胜人类最强大脑代表王峰。
*语音识别
目前的社交新媒体和互动平台中,AI虚拟助手和AI聊天机器人正在崛起。一天,美国GIT(佐治亚理工大学)的一个课堂上来了一位助教,教师讲完课后说:“大家有问题就问助教吧”。这位助教原来是个会眨眼睛的机器人!这时学生们才知道每天网上给他们答疑解惑的是人工智能,此前学生们也感到很吃惊,这位助教非常敬业,晚上还在发Email。
*人工智能语音合成
指从文本声音到真实声音,可以自动翻译成英文。2016年9月19日,谷歌DeepMind推出WaveNet,实现文本到美式英语或中国普通话的真实感语音合成。
*人工智能速记员
包括语音识别和NLP(自然语言处理)。2016年10月17日,微软的语音识别系统实现了5.9%的词错率(WER),媲美人类专业速记员,且错误率更低;中国科大讯飞也有语音输入法。
*人工智能翻译
中国人往往从小学到读博士都在学英语。现在,谷歌、微软和百度等公司在做人工智能翻译。以谷歌为例,2016年9月27日,谷歌的神经机器翻译系统(GNMT)实现了多语种翻译,较之传统方法,英译西班牙翻译错误率下降了87%,英译汉下降了58%,汉译英下降了60%,已接近人工翻译的水平。也许今后学外语没那么重要了,人们可戴着耳机,耳机能直接翻译成各国语言。
*人工智能对抗训练
Goodfellow(2014)提出的生成式对抗网络(GAN),为半监督学习/举一反三式的学习发展提供新思路,2016年发展迅速。目前是监督式学习,需要依靠大数据,因此大数据需要非常完备。而人是举一反三式的学习。例如人没有见过飞机,看过几张照片就可以把世界上所有飞机都认出;目前的大数据驱动的深度学习方式,是把世界上所有飞机照片都看过才行。现在进行举一反三的半监督或无监督式学习,思路是采用对抗的方法,一个网络造假,另一网络鉴别照片是真是假,通过对抗式的学习来共同进步(如图4)。
*人工智能引擎
芯片三巨头——英特尔、英伟达和高通全部转到了人工智能上。为此英伟达的股票涨了几倍。英特尔也在大搞人工智能。高通为了进入人工智能领域,收购了恩智浦,恩智浦此前收购了飞思卡尔。
现在出现了基于超级GPU/TPU集群的离线训练,采用超级GPU/TPU集群服务器,例如英伟达的深度学习芯片Tesla P100及DGX-1深度学习计算机,谷歌数据中心的TPU。
终端应用采用GPU/FPGA-based DPU,例如英特尔Apollo Lake A3900的“智能互联驾驶舱平台”,高通骁龙的820A处理器。
*通用人工智能与认知智能
1997年,IBM的超级电脑程序“深蓝”击败国际象棋大师加里•卡斯帕罗夫;2011年2月,IBM的自动问答系统在美国最受欢迎的智力竞答电视节目“危险边缘”中战胜了人类冠军;IBM的沃森医生在某些细分疾病领域已能提供顶级医生的医疗诊断水平,例如胃癌诊断。
可见,1.AlphaGo和Master等已可横扫人类围棋职业顶尖高手,下一步,将能下中国象棋等所有棋类,此外还可以打牌、炒股等,即什么都可以干,是强人工智能。2.人工智能已成为无人驾驶汽车商业落地的关键。3.视觉物体识别、人脸识别、唇语识别等在许多国际公开评测中,达到或超过人类的水平;4.速记等语音识别已可媲美人类;5.包括神经机器翻译在内的自然语言处理,性能也大幅度提升;6.生成式对抗网络得到极大关注。
目前,发展通用人工智能成为普遍共识。
2 社会极大关注
未来,可能很多工作就会消失了。
人工智能引起社会的极大关注和热议,人工智能发展很快;而且人工智能的学习速度快,很勤奋,未来可以达到人类所有的智能,这时到达了从强人工智能到超越人工智能的奇点;人工智能有超越人类智能的可能;理论上,人工智能还可以永生。
这也引起了很多人们的担忧。奇点到来、强人工智能、超人工智能、意识永生、人类灭绝等耸人听闻的观点出现,引起包括霍金、盖茨和马斯克等在内的世界名人对人工智能发展的担忧。在每年的世界人工智能大会上,专门有一个论坛探讨人工智能与法律、伦理及人类未来的会场。
现在,人工智能工业的OpenAI成立。
2016年全社会对人工智能的极大关注,可能是2016年AI的最大进展!
在半监督/无监督学习、通用人工智能方面,人工智能具有举一反三,并有常识、经验、记忆、知识学习、推理、规划、决策,甚至还有动机。这最后一点有点恐怖,人是有意识和动机的,机器做事也有动机,太可怕了。
智能学习进步很快,Alpha Go八个月后就可以战胜所有围棋手,因为它能每天24小时学习、不吃不喝地学习,比人强多了。
因此,在经历了60年“三起两落”的发展后,以深度学习为主要标志的人工智能正迎来第3次伟大复兴,这次引起社会尤其是产业界高强度的关注。因为上世纪60年代和80年代,人工智能没有达到这样的水平。
硅谷精神教父、预言家凯文•凯利说,未来人工智能会成为一种如同电力一样的基础服务。斯坦福大学推出了“人工智能百年研究”首份报告——《2030年的人工智能与生活》。
3 人工智能上升为国家发展战略
有人认为第四次工业革命即将由人工智能与机器人等引爆。英国政府认为,人工智能有望像19世纪的蒸汽机革命那样彻底改变我们的生活,甚至人工智能给人类社会带来的变革与影响,有可能远远超过蒸汽机、电力和互联网带来的前三次工业革命。
智能制造、无人驾驶汽车、消费类智能机器人、虚拟助手、聊天机器人、智能金融、智能医疗、智能新闻写作、智能律师、智慧城市等可能被人工智能代替。人工智能将无处不在,可望替换人类的部分脑力劳动,一些职业会被取代或补充,一些新的行业又会诞生,例如18世纪出现了纺织工人,之后汽车代替了马车等。因此,我们将经历从“互联网+”到“人工智能+”。
中国“互联网+”与“中国制造2025”国家发展战略的实施,对人工智能的巨大需求在迅速增长。未来2~5年,人工智能应用与产业发展将迎来爆发期。
中国政府在《“互联网+”人工智能3年行动实施方案》提出:计划在2018年形成千亿级人工智能产业应用规模。2017年1月10日,科技部部长万钢称,将编制完成人工智能专项规划,加快推进人工智能等重大项目的立项论证。
美国政府在2016年10月13日出台了《为人工智能的未来做好准备》的报告,提出了23条建议措施。同一天,美国政府又出台了《国家人工智能研发战略规划》,提出了7大重点战略方向。美国参议院于2016年11月30日召开了关于人工智能的首次国会听证会,主题是“人工智能的黎明”,认为中国是对美国人工智能全球领导地位的一个真正威胁。在2016年12月20日美国白宫发布了《人工智能、自动化与经济》报告,考察了人工智能驱动的自动化将会给经济带来的影响,并提出了国家的三大应对策略方向。可见,奥巴马把人工智能看作其政治遗产之一(注:另一个是Cyber空间)。
英国政府2016年12月发布了《人工智能:未来决策的机遇与影响》的报告,关注人工智能对社会创新与生产力的促进作用,论述如何利用英国人工智能的独特优势,增强英国国力。
日本政府2017年开始,要让人工智能与机器人推动第四次工业革命。
4 我国对策
应以深度卷积神经网络为核心,全面开展计算机视觉、语音识别和自然语言等人工智能产品的开发与大规模产业化应用。这需要大数据、计算平台/计算引擎、人工智能算法、应用场景等飞速发展,另外还需要资源、资金、人才。在方法上,选定垂直细分领域最重要。
面向若干细分垂直领域,建立大数据中心。实现大数据采集、清洗、标签、存储、管理与交易,建立大数据源公共基础设施与垂直领域知识库。专有大数据是人工智能产业制胜的关键和法宝。中国企业必须开始特别关注大数据的采集与利用。其重要性如同原油一样,跨国企业视之为战略资源!
强力开展人工智能芯片与硬件平台的研发。包括基于FPGA的深度学习芯片;类脑芯片与忆阻器件;建立国家级人工智能超算中心。
布局通用人工智能与认知智能前沿技术探索。加强与脑科学、认知科学、心理学等的多学科交叉融合创新,推动原创性基础研究,为中国人工智能的应用与产业发展提供支撑。
创新体制机制,抢占人工智能战略制高点。加强国家科技创新体系建设,改革学术与科研投入产出评估体系。面向国家重大战略需求与经济社会发展急需,通过体系的创新来保障技术与产业创新的实现,打通“政、产、学、研、用”各个环节。例如建立国家DARPA(美国国防高级研究计划局)和中国的阿拉莫国家实验室。
本文来源于《电子产品世界》2017年第2期第23页
网友评论