美文网首页
参加“中国音频技术大会”的一点收获

参加“中国音频技术大会”的一点收获

作者: 王双_c261 | 来源:发表于2020-09-27 22:59 被阅读0次

原创 精进学思行 精进学思行 今天

中国音频技术大会,第一次在上海召开,因为其中有个重要的“金耳朵”培训环节,于是报名参加了,刚好也跨界了解了一下当前音频行业在中国的发展。大会分享者都是行业的大咖,有来自华为、小米、阿里等不同公司的专家,也有来自中科院声学研究所的教授,大会总共持续了一天半的时间,限于篇幅和当前理解,无法全部分享,只介绍我印象比较深刻的三点:

音频行业的产业链和当前热点是什么?

汽车中有哪些和音频技术相关的技术?

什么是金耳朵以及为什么需要金耳朵?

1 音频行业产业链

1.1 音频系统构成

我们通常说的音频行业包括哪些内容呢?分享中,科大讯飞的马桂林和田德文做了一个系统的梳理。

首先是马桂林,他把音频系统分为了上行链路和下行链路,上行链路包括:音源-环境-硬件-软件-后端。从下面这张图当中,我们可以看到,音源可以是人的语音,或者是弹奏的音乐;环境指的是声波充满的空间,如一个房间或者音乐厅;硬件通常指的是麦克风;软件就是一些音频处理手段,比如噪声消除;后端可以是机器人,比如我们现在的机器人客服,也可以是进行对话的人或者享受音乐的人。

下行链路主要包括:音源-软件-硬件-环境-终端,和上行链路最大的不同的是,环境放在了软件和硬件的后面。我理解上行更偏向于声音信号的采集和处理,而下行更偏重声音信号的处理和回放,同时,在上行中包括了我们通常说的语音识别和通话功能,而下行更加突出了声音的回放。

在这里可能你有疑问,为什么环境也算在了音频系统中,毕竟我们在音频系统中不会去设计环境,而环境通常是给定的条件,所以,如果剔除了这里的环境和后端/终端,那么就得到了更加简洁的版本,这就刚好对应了田德文博士的分享,他用了一个不同的名字,叫“声学系统”,包括:麦克风,音频的IC(integrated circuit),扬声器,这是一个典型的“输入-处理-输出”模型。

1.2 市场规模和趋势

对于上面三个领域,国内外的现状和市场规模是什么样子呢?田德文博士也给了一个很详细的总结,如下所示,三个领域的市场份额是:扬声器>音频IC>麦克风。而且,可以看到中国的音频市场占据全球约1/4,整体增速也比全球高约2.4个百分点,但是值得注意的是,在音频IC领域,中国市场的增速是要小于全球的。

上面提到扬声器在三项中规模最大,而最近两年的爆款也是出现在这个类别中,中科院声学所的李晓东教授统计发现,当前最爆款是智能音响和无线耳机,他们最近的增速分别是70%和250%。

未来会是什么样呢?田德文博士给出了他的判断,他认为基于大数据和物联网的发展,声学产业最大的价值会出现在“Analytics”方面,也就是情景认知和智能终端,我理解就是基于大数据科学的智能音频,比如能通过声音更好理解人的情感,并提供人性化的服务。

除此之外,华为手机产品线副总裁李昌竹给出的方向也很有启发,他认为音频未来的三个发展方向分别是:享受品质,提升效率和生态创新。享受品质就是提高声音的品质,无论是通过声场优化,还是更好的解码编码以及降噪技术;提升效率,就是让人们使用音频更加方便,甚至让音频提高人们的效率,比如实时的语音翻译;生态创新,就是让音频融入更多场景,比如在健康管理中的应用。

2 汽车中的音频技术

因为我是做汽车声学,所以更加更加关心在汽车中,会有哪些音频技术呢?科大讯飞和哈曼的分享很有启发。其中科大讯飞分享了全闭环测车载语音交互系统,从这个图中,我们看到,其实它不止语音交互,还包含了在车上的听音效果。

如果说科大讯飞的核心优势在于语音识别,而哈曼的优势则是声音本身的体验上,下图是哈曼涵盖的声学领域,不仅有常规的高品质音效和声场,也有比较创新的主动降噪和各种模拟音效(如内部电声合成)。

而在语音识别中,有一个让我很感兴趣的话题,也是在这次大会中不同讲者中反复提到的,就是在声音处理中,传统信号处理和神经网络的优劣和互补,科大讯飞比较了两种技术手段在语音识别中的优劣,如下图:

而声加科技创始人邱锋海也对比了两种方式的优劣:

这个问题,等我研究后,有机会单独分享。

3 金耳朵培训

最后就是“金耳朵”培训, 这是我参加这个会议的主要目的,培训者是前哈曼高级声学总监李胜波,培训要持续2个月,第一次集训是一些基础入门和练习软件介绍。

3.1 什么是金耳朵?

"金耳朵"是对一部分特定人群的俗称,这部分人通过长期的训练和非凡的听音经验,对于音响的音质属性或者是音乐的基本要素,有超出常人的鉴别和鉴赏能力,而它主要包括两种类型,第1种是技术类型的,是音响界的,要具备正常的听力,了解频率,失真噪音等概念,并对声音的各个维度的细微变化比较敏感;而第2种是偏艺术类的,它是音乐界的事情,需要了解音乐知识,听音过程,更需要调动高级的神经活动来辨别音调,节奏,和声旋律等,这两种金耳朵是不能相互混淆和替代的,它们的基本方法也各有不同。

如果你想判断一个音响好不好要找前者,如果你想知道一个音乐好不好,要问后者,不能搞混淆了。

3.2 为什么需要金耳朵?

金耳朵当然是比普通耳朵更“灵光”,但是我们都有了很完备的客观测试设备,为什么还需要金耳朵来做主观的评价?首先,有些主观的东西是无法测量或当前很难测量的,比如结构振音和声音定位;其次,我们现在掌握的客观测试指标,不足以涵盖所有的主观感觉,而且有些物理指标和主观的关系还存在争议;最后,主观和客观在本质上它是一致的,但是,主观的正确结果取决于评价者的认知观念的正确性,金耳朵就是有比较正确认识观念,能将主客观比较好联系起来的人,这是金耳朵培训的价值。

总结

一次半跨界的参会,让我对音频行业略有了解:

1、音频产业链主要包括:麦克风、音频IC和扬声器,当前增长最快的是智能音箱和无线耳机;

2、未来的音频主要趋势:享受品质、提高效率和创新生态;

3、金耳朵是一种超乎常人的鉴别能力,分为“技术型”和“艺术型”,两个有很大的区别。

相关文章

网友评论

      本文标题:参加“中国音频技术大会”的一点收获

      本文链接:https://www.haomeiwen.com/subject/zzdruktx.html