做实验需要控制所有视频的声音的大小差不多,不然有的视频的声音太大有的太小,影响被试的反应;因此需要对视频中的音频进行标准化,这是在做音频标准化过程中搜集到的资料,在这里汇总一下,基本是从音频标准化入门到放弃。
Audio normalization是什么?
内容来源:
Audio normalization可以分为两种做法:Peak (level) normalization 和 Loudness normalization。
Peak normalization:
将声音最大(peak)的地方,调整到特定音量(如最大0 dBFS),然后其他音频做相应的增/减调整。优点是只要找出最大声音处,就能决定整体的音量调整。缺点是peak对于整体音频不一定具有代表性,比如某个时刻出现爆炸声,并不一定整体都是爆炸声,那标准化的结果会因此受到影响。这个操作的一般应用在录音阶段,在录音时提供一个声音的范围。用这个方法处理音频之后,可能音频声音最大处的声音提高到了特定的音量,其他的音段也提高了,但是有可能和最高音相比还是差很多。
Loudness normalization:
先计算出整体声音的平均音量,再根据平均音量到期望音量的差值,做为调整的依据,最后使的平均音量达到期望音量的大小。优点是平均音量比较有代表性,缺点是计算比较复杂,大音量在调整时,由于音量爆表被切掉了,各个音量之间的对比也变的不一样。应用场景:当音乐表单中有很多歌曲时,这些歌曲的声音大小都不同,有的歌曲的声音很大,有的很小,这样会迫使使用者不断调整音量的大小,所以需要一个标准来解决这样的问题。比如YouTube,他的音量的大小是−14LUFS,如果上传者的视频的声音大小为−10 LUFS,,那么他就会把上传的音频再降低4 dB,使其达到平台的标准的声音。
Audio normalization 怎么做?
How can I normalize audio using ffmpeg?
其实有很多软件可以用的,比如MP3Gain,Audition...之类的,但是本着自己动手丰衣足食的想法,还是去谷歌了一下,连接上介绍用ffmpeg和 ffmpeg-normalize 的python库的方法,这两种方法本质上是一样的,最后都是用ffmpeg来实现的。
Audio normalization 的标准是什么?
这里介绍了音频处理的常识和一些名词
名词解释
增益,英文是gain,其定义是:对元器件、电路、设备或系统,其电流、电压或功率增加的程度。通过这个定义可知,在对音频设置增益时,音量提升了,音频输出的电流、功率也随之提升,假如音频具有很大的噪音,噪音也会随着增益的升高而变大,尤其是有交流声噪音的音频,因此音频增益不只是简单的放大音量。增益的单位是分贝dB。
网友评论