随着智能时代的飞速发展,尚未成熟的AI产品在发布会现场总会出现一些尴尬的演示瞬间。编者还记忆犹新的是2018年小米AIoT开发者大会上,雷军多次对话小爱智能蓝牙音箱时,结果小爱同学不予配合。雷军问“三个木叫什么”,小爱同学回答“你是电,你是光,你是唯一的神话”。由此可见,技术相对较成熟的智能音频产品依然不够完善。据行业专家分析,任何智能化产品如果需要涉及到语音交互,拾音技术的优化迫在眉睫,雷总出现的尴尬就原于硬件对声音的拾取和判断,也就是“听的到?”和“听的懂?”的问题。
然后,听到和听懂的第一步在于准确的获取用户的声音(即拾音),否则无论云端的虚拟助手多么智能,也是无头苍蝇。麦克风阵列是语音交互的第一步,简单来讲,麦克风阵列是由2个及以上麦克风按一定规则排列组成,在特定空间对声音进行获取和处理的录音系统,在智能音箱落地中有关键作用。市场可见,不仅传统的芯片公司,语音技术巨头和有深厚技术背景的初创公司纷纷加入这一领域。
小编走访一直对声音技术深耕多年的国产芯片原厂炬芯科技得知,拾音其实分为远场拾音(1米外)和近场拾音(20cm内)。比如,以Siri为代表的智能手机就是近场拾音,采用的是单麦克风,可在近距离、低噪声的情况下拾取符合语音识别需求的声音。但是一旦将智能手机放在有噪声的较远的距离,Siri的识别率就会直线下降,单麦克风的局限就凸显了出来。不仅如此,由于噪声、混响等因素的存在,远场拾音还要与远讲语音识别算法相匹配,才能真正做到“听清和听懂”。
据业内技术大咖介绍,早在20世纪七八十年代,麦克风阵列已经被应用到语音信号处理中,进入90年代以来,基于麦克风阵列的语音信号处理算法逐渐成为一个新的研究热点。近年来随着语音交互成为趋势,麦克风阵列逐渐进入消费市场领域,日趋火热。
提到真正的语音交互智能设备,不得不说起亚马逊在2014年底推出的Echo智能音箱,其采用6+1麦克风阵列,支持5米远讲语音操控。Echo虽然是第一款真正意义上的智能音箱设备,再加上亚马逊强大的技术和资源支持,它依然需要4年甚至更长的时间去打磨产品,直到2018年才陆续被消费者认知和选择。由此可见,语音交互和对声音的前处理技术仍然需要升级,应该研发出更强悍的主控芯片,通过硬件解决好拾音和传送功能,让声音的传达变得更加的精准和效率。
小编此次走访的是中国领先的低功耗消费类系统级芯片设计厂商炬芯科技,为无线音频及智能耳穿戴、智能多媒体、智慧计算及物联网等产品领域提供专业芯片及完整解决方案。在音频领域,炬芯已经推出了众多蓝牙和wifi智能产品方案,深受国内外品牌商的青睐,源于炬芯一直坚持“对声音体验的无限追求”的初衷,且一直不断的投入和升级技术团队,方才成为领先的声音前处理技术芯片设计公司。
网友评论