继北京站之后,4 月 18 日,云知声开放日(Open Day)第 2 场来到深圳。本次云知声开放日聚焦 AI 技术、应用和产业,云知声董事长/CTO 梁家恩博士与多位云知声技术专家向深圳的合作伙伴、行业人士全面的秀出了全栈 AI 硬核技术,并与腾讯杰出科学家/腾讯 AI Lab 副主任俞栋、携住科技联合创始人叶明、同行者科技联合创始人叶维、金鹰卡通卫视产品总监戴文博、三诺声智联副总经理乔峤等多位嘉宾,剖析了 AI 技术在酒店、车载、教育等领域的应用及落地。
全栈:技术能力全栈,产业服务全栈
梁家恩博士作为人工智能行业的资深从业者,在现场与我们复盘了发展历程,他表示,在 AI 大潮退去之后,技术的产业化能力成为了决胜的关键。技术如果不能解决产业问题,那么技术将化为企业“炫技”的产物。基于此,梁家恩博士将云知声的 AI 哲学概括为“全栈”和“硬核”。
“全栈”包含了全栈 AI 技术能力和全栈 AI 落地能力两个维度。经过多年的发展,目前,云知声的 AI 能力已经超了单一的语音技术,覆盖了 Atlas 机器学习超算平台,信号、语音、图像、文本的感知和表达能力,知识、理解、分析、决策等认知技术,并朝着多模态人工智能系统方向发展。同时,云知声通过将能力封装在自研 AI 芯片之上,打磨了“云端芯”一体化产品体系,推动 AI 技术在家居、车载、儿童、教育、医疗、金融、零售等多个领域实现落地,实现了从 AI 技术到产业应用的生态闭环。
硬核:确实、有效地解决产业规模化痛点
“硬核”,指技术方案能够确实、有效地解决产业规模化痛点,为终端用户提供相对成熟的用户体验。
以当时最热门的智能语音为例,经历了两年的市场教育,现如今,语音交互技术被广泛应用到各大场景中,成为了 AI 技术落地最典型的应用案例。然而,在实际使用中,AI 需要面对的情况比实验室中要复杂得多,一旦产品软硬件的某一环处理不好,便容易出现“听不到、听不懂、答非所问”等问题。针对这类行业痛点,在本次云知声开放日深圳站现场,云知声的技术团队从语音交互技术的拾音、识别和交互等维度,深度剖析了技术难点和解决方案。
在 AIoT 场景下,设备首先要解决的便是远场拾音问题。云知声 AI Labs 技术专家关海欣表示,解决远程语音识别的关键在前端信号处理阶段,解决回声、混响和噪音 3 大核心问题,以确保设备可以准确识别到用户指令。目前,云知声在回声消除、混响抑制、噪声处理等方向均已有成熟的技术方案,相关技术指标均达行业一流水准。另外,未来远程语音识别还将呈现 DSP+DL 结合、分布式拾音两大趋势,对此,云知声也已经展开了相应的技术部署。
在语音识别阶段,则需要在声学和语言层面,赋予机器感知并语音指令的能力。云知声 AI Labs 技术专家李轶杰表示,声学方面,云知声基于大数据、前沿声学建模、自适应学习搭建了声学模型;在语言层面,云知声创建了一个数据规模大、融合能力强、灵活和个性化的语言模型,以上模型在还将基于超算平台不断优化迭代。此外,云知声还将其语音识别能力延展到语音评测、声纹识别、情绪识别等多个方向。
在对话阶段,围绕更加自然的人机交互,云知声打造了流式交互、语用计算与知性会话 3 大硬核能力。云知声 AI Labs 技术专家单波介绍到,流式交互最大的特点是在多轮对话免唤醒,大大的提升了人机对话过程中的流畅程度;语用计算则是将人机对话内容放置到对应的语境中,让设备准确的理解人的意图;最后,知性会话则是通过将知识图谱应用到人机对话过程中,让设备准确的响应用户的问题。
基于上述技术,2013 年,云知声面向合作伙伴开放对话技能开放平台(语义云),帮助合作伙伴打造更加自然的人机交互体验,同时在实践中不断提升语义解析能力。目前这一平台已经支持 200 多个的对话内容,覆盖通讯、休闲娱乐、医疗健康、交通出行、设备控制等多个场景,语义解析准确率高达 93%。
值得一提的是,语音感知与表达、语言与知识计算只是云知声硬核 AI 技术的冰山一角,目前,云知声硬核技术还包含了 AIoT 芯片、超算平台与图像、翻译拓展等。
落地:覆盖酒店、汽车、儿童、音箱等场景
在大数据、深度学习、超算平台的加持下,人工智能底层技术将冲破阀值,带来成熟的体验,在技术和需求的双重推动下,人工智能将迈入发展的黄金阶段,并掀起新一轮的 AIoT 产业变革。在下午的「智能+」分论坛中,云知声副总裁康恒、云知声 AIOS 架构师郭洪光、与携住科技、同行者科技、金鹰卡通、三诺声智联等多位合作伙伴,结合实际案例,深入探讨了 AI 技术的在酒店、汽车、儿童和音箱等场景中的应用。
云知声副总裁康恒表示,在整个产业链中,AI 技术是个“基础设施”,且这一基础设置不可能在不加以定制的情况下适用全部场景。AI 在落地过程中,需要充分考虑使用场景和落地行业。基于对场景和产业的深度思考,2014 年,云知声便开始结合产业链,将云知声的 AI 技术赋能到个行业中去。
面向行业,云知声推出了一站式人工智能平台 UniOS。云知声 AIOS 架构师郭洪光表示,与同类产品相比,UniOS 具备开放、垂直两大特性,其中,开放指的是云知声面向行业和合作伙伴开放技能平台和设备平台,并在此基础上兼容第三方 AIOS;垂直则代表 UniOS 会针对特定的行业需求输出解决方案,以此来帮助产业转型。
携住科技联合创始人叶明跟我们介绍了 AI 技术在酒店场景中的应用案例。叶明表示,针对酒店场景,携住科技基于 AIoT 技术,通过多种设备联动、场景定制,为酒店客户带来全新智能互联的场景体验;另一方面,通过信息整合和大数据分析,AI 还将提高酒店管理效率。
携住科技联合创始人叶明
同行者科技联合创始人叶维分享了 AI 语音技术如何助力汽车产业升级。叶维表示,在车载场景下,语音即为服务——语音是用户与设备、与互联网连接的主要手段,承载了车联网资源整合与用户触达的功能。因此,车载场景下的 AI 必须聚合丰富的内容和服务,并根据场景进行智能匹配,打造千人千面的智能化体验。
同行者科技联合创始人叶维
金鹰卡通卫视产品总监戴文博分享了金鹰卡通对儿童产品智能化的思考。戴文博指出,儿童和家长对智能产品的需求与普通场景十分不同,基于此,金鹰卡通围绕儿童场景的特征,将 AI 技术与“麦咭”的形象做了深度整合,打造麦咭智能亲子智能产品生态。
金鹰卡通卫视产品总监戴文博
三诺声智联副总经理乔峤从产品角度出发,与我们分享了人工智能产品设计思考。乔峤指出,人工智能时代的设计方向是感知设计,产品只有将形状、外观、听觉、触感等诸多因素综合成一个完整的信息,充分调动人类的本能,才有可能设计出更普遍更通用的产品。
以带屏音箱为例,屏幕为人机交互补充重要的视觉信息,更加接近用户本能,“未来 5 年,单带屏的智能音箱就会达到 3 亿多台,超过 PC 的规模。”
网友评论