具有场景感的 3D 环绕音乐
前一段时间,一段 3D 环绕音频在国外的社交软件 What's APP 上被广泛转发,感兴趣的读者可以戴上耳机感受一下。
(只有佩戴耳机才能见证奇迹哦)
实不相瞒,我已经无限单曲循环了~ 但是作为声学人,我们不能止步于知其然,还要知其所以然!!!
接下来,我们就来聊一聊用耳机播放 3D 环绕音频的原理,并在 Matlab 平台上以 MIT 提供的数据库做了一个简单的演示,附在文末。
大家都知道,我们可以凭借一只耳朵来感受声音的响度,音调和音色。但是如果想在空间中辨别出声音的方向,必须依靠两只耳朵,原因在于两只耳朵才可以听出时间差。
比如在下图[0]场景,声源在我们的右边时,我们的右耳会先听到声音,之后左耳才会听到声音。
当然,时间差对于声音方向的辨别只是一个方面。仅仅依靠时间差,双耳虽然可以听出左右的差别,却听不出前后的差别,因为前后对称的两点产生的时间差是一样的!
双耳如何分辨前后
那我们的双耳是如何辨别出声音的前后方向呢?
接下来就先回答这个问题。
事实上,声音从发出到被我们的耳朵听到,一共经历了三个过程——传播过程、生理过程和心理过程 [1]。
传播过程也称为物理过程,是指声源发出的声波经由介质到达耳廓再通过耳道传递到鼓膜并引起其振动的过程。这是一个极其复杂的过程,例如听觉环境的不同会导致传递到耳廓的声音波形千变万化;人耳廓构造的不同会使声波经由耳廓滤波后的波形也不尽相同;耳道的不同也会引起到达鼓膜处的声波属性发生变化。
生理过程是指鼓膜的振动经由听骨链传递至内耳卵圆窗,继而使前庭淋巴液、前庭膜、蜗管内淋巴、基底膜相继发生振动;基底膜的振动使螺旋器的毛细胞产生神经脉冲,形成动作电位,通过听神经传至大脑皮层颞叶形成听感的过程。
心理过程是指根据已有的生活经验,对大脑皮层听觉中枢形成的听感进行解释加工形成听觉认知的过程。
由于生理过程和心理过程几乎不可操控,我们这里仅仅关注传播过程。显而易见,正前方声源的传播过程和正后方声源的传播过程是不一样的!因为我们的耳朵并不是前后对称的。
那么这两个传播过程到底有什么不一样呢?如图所示,正前方声音的传播过程如下左图所示,正后方声音的传播过程如下如右所示。
这两个传播过程的不同是肉眼可见的。前方的声音经过耳廓反射,进入耳道;后方的声音需要绕过耳廓,进入耳道。但是我们如何用科学的语言来描述和衡量这种不同呢?
很自然的,熟悉信号处理的你一定会选择用频响曲线来观察这两个过程到底有什么不一样,这也与从频率的角度来研究声音的生理过程和心理过程不谋而合。话不多说,下图是前后两个传播过程的频响幅度曲线
两条曲线差别还是很大的。上图的曲线本质上是声音的传播过程在频域的一种映射。宏观地讲,正是这条线的不同会对生理过程和心理过程产生一系列的影响,以至我们可以辨别出前后方向的声音。
头相关函数
很形象地,因为这条曲线与人头(听着瘆人,以下用 Head 代替)相关,研究人员便把这个曲线(函数)定义为头相关函数,是不是很有意思?忽然之间体会到了做科研的乐趣。换句话说,我们可以用头相关函数来对声源的传播过程进行模拟。
我们来做个小结:
通过信号处理的方式,我们定义了头相关函数来模拟不同方向上声源到耳朵的传播过程,而我们把耳机里的音乐通过不同方向的头相关函数处理之后,就能起到“迷惑”耳朵的作用,进而“欺骗”我们的大脑。
既然一切的问题都指向了头相关函数,我们就来仔细咂摸一下头相关函数。
首先,它是一个函数。既然是函数,肯定是有自变量的,头相关函数的自变量是什么呢?也就是说,什么因素会影响头相关函数呢?
很显然,其中一个变量一定是方向。毕竟这玩意是我们由前后方声源传播过程启发而得到的。换句话说,不同方向声源的传播过程的传递函数是不一样的。其次,应该跟距离有关系。但是,请问你能分辨出声音离你的距离吗?答案是否定的。经过对比,研究人员发现当距离超过 1m 时,头相关函数的差别并不明显,可以认为和距离无关 [2],这也是与我们的日常经验相符合的。
还有一个不可忽略的变量,那就是 Head!不同 Head 对声源传播过程的影响肯定是不一样的。如下面这一对父子,他们的头相关函数差别应该挺大的,声音从大头儿子的后面进入耳道需要绕一个更大的圈儿~
因此,我们认为头相关函数是高度个性化的 [3]。
的确,即使我们把同一个 Head 的不同方向的头相关函数测试完做成一个数据库,那么,不同 Head 的数据库也是不一样的,那总不能把地球上 75 亿多个 Head 都测试一下,给每个人做个数据库吧!
因此,考虑到成本问题,很多研究机构都是测试一个类型 Head 的头相关函数,比如欧洲人,做成数据库供该类型的 Head 使用。其中有一些研究机构公开了他们的数据库,如 ARI、CIPIC、MIT 和国内的华南理工大学等。
我们以 MIT [4] 为例,做一下简介。1994 年 5 月,MIT 媒体实验室完成了对 KEMAR 假人头的一系列与头部有关的传递函数(HRTF)的测量。测量包括安装在距 KEMAR 1.4 米处的 Realistic Optimus Pro 7 扬声器的左右耳脉冲响应。使用最大长度伪随机二进制序列以 44.1 kHz 的采样率获得脉冲响应。从 -40 度到 +90 度的俯仰角总共采样了 710 个不同位置的数据。
关于头相关函数的测试方式也有很多研究,感兴趣的读者可以阅读这篇文章 [3],这里受限于篇幅,就不展开叙述。
最后,我们用 MIT 的数据库做了一段环绕音频,并配上方向指针,请佩戴耳机欣赏!
转微信文章观看视频
参考文献:
[0]Spatial Audio and Immersion - VR’s Second Sense - Google I/O 2016
[1]俞胜锋. 基于脑电的双耳听觉定位的初步研究[D].华南理工大学,2019.
[2]黄劲文,杨飞然,杨军.头部跟踪器的虚拟声源定位系统[J].网络新媒体技术,2019,8(02):28-35.
[3]杨飞然.头相关传递函数测试新方法[J].应用声学,2014,33(03):263.
[4]https://sound.media.mit.edu/resources/KEMAR.html
- End -
21dB是中国科学院声学研究所苏州产业化基地旗下科技媒体,专注于声学新技术、 音频测试与分析、声学市场调研、声学学习社群建设等。
我们传递知识:矫正声学群体易有的错误认知,普及声学领域的实用技能;
我们聚焦前沿:窥探新技术如何突破瓶颈、石破天惊,指南未来道路如何筚路蓝缕、柳暗花明;
我们挖掘思想:交流相关话题,解说发展现状,剖析行业日常,探讨政策推进……我们被声学人选择,我们为声学人发声。
这里有知识的饕餮, 有充盈的灵魂, 有你想要的一面。如果你和我们一样,有对声学的兴趣和热爱,有对前沿讯息的敏锐触角,有对技术原理的深入挖掘,那么欢迎加入我们。
如果你需要:
A: 声学类稿件投稿
B: 声学项目合作
C: 创业支持
请发送相应需求和名片至 21db@ioasonic.com. 我们将安排专人与您联系。
网友评论