全球正在经历新一轮的科技和产业革命,人工智能作为这一轮革命的风暴中心,成为各国争相竞逐的赛道。面对人工智能的热潮,全球科技巨头纷纷加码投资,开始深度布局此领域,从全球科技公司所提交的人工智能专利申请来看,主要的技术专利集中在语音交互、人脸识别、AI芯片、机器学习等领域,本文针对以上提到的热门领域,搜罗了2018年出现的十大革新性技术,下面让我们一起看看这些技术都有哪些“过人”之处:
一、语音交互技术就是一种以语音为主要信息载体,让机器具有像人一样“能听会说、自然交互、有问必答”能力的综合技术,它涉及自然语言处理、语义分析和理解、知识构建和自学习能力、大数据处理和挖掘等前沿技术领域。在这一领域,科大讯飞占据了超过60%的市场份额,绝对是语音技术的龙头企业。
代表技术:讯飞听见M1转写机器人
讯飞听见M1转写机器人是2018年科大讯飞发布的一款以专业录音及转文字为核心功能的智能转写机器人,可满足会议、采访、课程培训等多种场景下的录音整理需求,帮助快速提升工作效率。
讯飞听见M1转写机器人采用了24bit高精度拾音芯片,通过对环境、室内混响、方向性噪声进行智能化抑制,显著提升拾音效果,实现数字降噪、无损录音的优秀效果。M1还采用了科大讯飞7+1环形麦克风阵列,做到360°全向型自动声源定位,10米以内的有效声音可以轻松拾取,高品质录音无压力。基于科大讯飞深度全序列卷积神经网络转写能力和Dereverberation去混响技术,讯飞听见M1可实现的中英文语音转文字识别准确度高达95%。
机器人对话交互系统:iBot Pro
小i机器人自主研发的iBot Pro具有独创多模型混合引擎、全闭环智能运营平台、多模态情感和场景交互三大特征,大幅优化了用户体验,重构了整合深度推理、语义理解、深度学习三种能力的智能交互引擎,内置了小i多年积累的领域语义库,适用行业更广泛,可为旅游、金融、电信、政务等多个传统行业快速开发出具有深度语义交互能力的问答机器人。
对话式人工智能系统:DuerOS 3.0
DuerOS是百度度秘事业部研发的对话式人工智能系统,操作系统是用户与硬件之间的连接,最核心的价值就是人机交互,DuerOS的初心就是要给用户提供基于AI的自然交互,特别是语音交互,让机器能听会看,搭载DuerOS的设备可让用户以自然语言对话的交互方式,实现影音娱乐、信息查询、生活服务等10大类目的500多项功能的操作。
2018年发布的DuerOS 3.0相对于此前版本,在自然交互能力上进行了全新升级,不只是强调语音,还强调自然语言处理和机器视觉,支持情感语音播报、声纹识别、儿童模式、极客模式、智能引导与纠错、视觉搜索能力、视频理解能力等功能。
二、正如人类被上帝赋予智慧一样,人工智能也被人类赋予智慧,而智慧的本质在于算法。人工智能是利用机器算法模拟人脑对历史知识学习、吸收与理解并掌握运用的训练过程。数据量的丰富程度决定了是否有充足数据对模型进行训练,进而使人工智能系统经过深度学习训练后达到强人工智能水平。
集成多场景AI算法的智能机芯:智芯H002
智芯H002是智芯数据针对穿戴类产品推出的多场景应用超低功耗机芯方案。智芯H002的一大亮点是在交互场景上可实现多场景、多人群动态切换,针对不同需求的功能定制化,升级数据分析与呈现。后台数据通过AI算法的自主学习,并存储、分析、修正行为偏好识别、行为状态预判,基于个人的行为偏好,以及私密圈子行为与偏好,进行更精准的信息及产品推送,打开并延展个人数据的商业价值。
在解决智能穿戴产品的续航问题上,智芯H002运行平台MCU Apollo 3 实现超低功耗控制,使电池寿命也得到极大的延长,超越续航极限,一次充电可使用至少30天。智芯H002搭载13种传感器组合,传感器的实时状态空间至少达2的13次方8192种,支持至少11种人群场景应用。目前,智芯H002后台AI算法已在睡眠管理,心率、血压、体温体征测量,跑步,登山,游泳,婴儿护理,日常活动等多个场景落地。
在智能手环无路可走,已然遭到嫌弃,智能手表不能解决续航痛点时,智能机芯H002 像一道光豁然打开智能可穿戴产品的真正价值,提供了颠覆性的行业解决方案。
三、边缘计算是在靠近物或数据源头的网络边缘侧,融合网络、计算、存储、应用核心能力的分布式开放平台,就近提供边缘智能服务,满足行业数字化在敏捷联接、实时业务、数据优化、应用智能、安全与隐私保护等方面的关键需求。它可以作为联接物理和数字世界的桥梁,使能智能资产、智能网关、智能系统和智能服务。
代表技术:Azure IoT Edge 开源
Azure IoT Edge 是微软推出的基于边缘智能计算,将云功能提供到边缘设备的,一种混合云和边缘设备的物联网解决方案。2018年微软Build大会上,微软宣布将 Azure IoT Edge 开源,允许开发者进行扩展、添加功能,并部署到任何环境中。
用户可以根据自己的业务逻辑自定义创建IoT应用,在边缘设备本地完成数据处理任务,同时享受大规模云平台的配置、部署和管理功能。即便在离线或间歇性连接状态下,边缘设备也可实现人工智能和高级分析,简化开发,并降低物联网解决方案成本。
四、人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。
代表技术:“炬眼”智能人脸识别相机
云从科技是一家从中科院重庆研究院孵化的专注于计算机视觉与人工智能的高科技企业,计算机视觉头部企业中唯一的“国家队”。由云从科技推出的“炬眼”智能人脸识别相机相较以往的智能摄像机在功能与性能上有了质的飞跃。“炬眼”智能人脸识别相机使用Intel架构,在摄像机本地完成全程识别,极速传输识别结果到后台,准确率高达99.8%以上。
“炬眼”智能人脸识别相机内置“枭龙”深度学习算法,相较于传统智能相机平均10秒的识别时间与50-500k的带宽占用,在处理同样的AI应用任务时,“枭龙”深度学习算法拥有大约50倍以上的性能优势,这意味着“炬眼”智能人脸识别相机可以用更高效的完成计算任务。
SenseAR增强现实感绘制引擎
为推动AR技术的应用和普及,2018年商汤科技发布了全新升级的SenseAR增强现实感绘制引擎,和中国原创AR开发者平台——SenseAR开发者平台,合力驱动AR应用和优质内容产出,打造AR生态。
全新的SenseAR增强现实感引擎在原有的106人脸关键点定位技术基础上,升级为240人脸关键点定位技术,对眉、眼、口、鼻、唇等五官部位实现更加细致、精准的定位和追踪,还开创性地实现了舌头跟踪,眼神追踪,头发染色等玩法,由此将AR应用推广到美妆拍照、高仿真度虚拟形象等复杂场景。
同时,商汤科技还将在面部识别领域的原创领先技术,应用到肢体、手势识别,从而将AR识别和绘制的能力从“脸部”延伸至“全身”,可以基于单目RGB摄像头,实现对手势、肢体动作的全方位精确描述和跟踪,极大拓展了AR技术的应用范围和场景,满足了视频平台不断增多的全身场景AR玩法需求。
五、AI芯片目前大致的分类:从功能角度看,AI芯片主要做两个事情,一是Training(训练),二是Inference(推理)。从应用场景角度看,AI芯片主要有两个方向,一个是在数据中心部署的云端,代表公司主要有谷歌,寒武纪等;一个是在消费者终端部署的终端,代表公司主要有地平线,云知声等。
自动驾驶:Matrix 1.0平台
在自动驾驶的阵营中,AI公司地平线聚焦算法、芯片技术。Matrix 1.0是基于地平线自主研发的BPU架构——征程2.0打造的,面向L3及以上自动驾驶的解决方案。
Matrix 1.0 采用深度学习技术,支持多传感器融合,可每秒处理720P视频30帧,实时处理4路视频,实现20种不同类型物体的像素级语义分割,而功耗仅为31W,已经达到商用水准,开发者也可以基于Matrix平台部署神经网络模型。
物联网AI芯片:“雨燕”
“雨燕”由云知声自主研发,采用CPU+uDSP+DeepNet架构,支持8/16bit向量、矩阵运算,基于深度学习网络架构,可将面向语音AI的并行运算性能发挥到极致,在更低成本和功耗下提供更高的算力。其异构AMP架构可保证高性能与低功耗的有机结合,从而获得更高的能效比,更适合IoT场景。
除了提供芯片和终端引擎,云知声还将应用部分向客户开源,同时提供相应定制化工具以及云端AI能力服务。通过云端芯结合,“雨燕”将应用于智能家居、智能音箱、智能车载等各个具体场景中。
云端智能芯片:Cambricon MLU100
与寒武纪系列终端处理器一样,MLU100云端芯片仍然延续了寒武纪产品一贯出色的通用性,可支持各类深度学习和经典机器学习算法,充分满足视觉、语音、自然语言处理、经典数据挖掘等领域复杂场景下(如大数据量、多任务、多模态、低延时、高通量)的云端智能处理需求。
MLU100采用寒武纪最新的MLUv01架构和台积电16nm的先进工艺,平衡模式下(1GHz主频)的等效理论峰值速度达每秒128万亿次定点运算,高性能模式下(1.3GHz主频)的等效理论峰值速度更可达每秒166.4万亿次定点运算,但典型板级功耗仅为80瓦,峰值功耗不超过110瓦。
点评:无论是语音交互,人脸识别还是AI算法,这些热门的AI技术的发展宗旨均是为了应对日常生活中所出现的各种复杂信息。未来AI技术的发展趋势也不难预测,将围绕不同的生活场景做垂直细分的技术落地。比如文中提到的智芯H002,其后台AI算法目前已在睡眠管理,心率、血压、体温体征测量,跑步,登山,游泳,婴儿护理,日常活动等多个场景落地,搭配智能腕表设备,将给日常生活带来更多便利。
网友评论