一、前言
音频文件通常分为两类:
声音文件
:通过声音录入设备录制的原始声音,直接记录了真实声音的二进制采样数据,通常文件较大
MIDI 文件
一种音乐演奏指令序列,相当于乐谱,可以利用声音输出设备或与计算机相连的电子乐器进行演奏,由于不包含声音数据,其文件尺寸较小
二、无损 & 有损
那声音文件同样也分为两类:
- 无损格式
- 有损格式
无损格式:只是对源声音文件进行无损压缩而已
有损文件:一是去掉人耳听不到的声音,频率在 20HZ 到 20KHZ 之外;二是基于声学心理学的模型,除去人类很难或根本分辨不出的声音,例如:一个音量很高的声音后面紧跟着一个音量很低的声音
格式 | 公司 | 类型 | 备注 |
---|---|---|---|
CD | 飞利浦 + 索尼 | 无损 | 音质最佳 |
FLAC | 开源,隶属 Ogg | 无损 | |
APE | 开源 | 无损 | |
WAV | 微软 | 无损 | |
AIFF | 苹果 | 无损 | |
RA / RM / RAM | realplay | 有损 | |
MP3 | MPEG | 有损 | |
AAC | MPEG | 有损 |
image.png注1:AAC 格式:新时代的有损压缩王者,跟 MP3 比 AAC 格式的音质更佳,文件更小,正慢慢取代 MP3 中。比如著名的 H.264 视频压缩格式,基于它的视频文件普遍挂载的就是 AAC 格式的音轨。
注2:FLAC 是现在网上最流行的无损格式。
注3:假无损:以有损的音源无损转换之后的文件,带着无损的面纱,长着有损的脸。
例如网上很多人反映网易云音乐的无损音乐是挂羊头卖狗肉,是利用频谱软件观察发现了端倪,
三、关键参数
1、Sample Rate - 采样率
image.png
我们以怎样的频率记录声音波形的变化(类似视频中的24帧)
44.1KHz,意味着每秒选取 44100 个采样点;48KHz 意味着每秒选取 48000 个采样点
一般认为 44.1KHz 就接近人耳极限了
image.png现在所有音频格式(从 CD 到MP3)一律采用 44.1KHz,而 DVD/BD 视频音轨一律采用 48KHz。
2、位深度
我们用多少字节的储存量来储存音频波形(类似视频的分辨率)
一般采用的是 16bit,及更高的 24bit,再高的深度意义不大
3、bit rate - 码率
image.png
码率就是数据传输时单位时间传送的数据位数,一般我们用的单位是 kbps 即千位每秒。
码率 = 采样率 * 位深度
所以评判音质,可以直接看码率就好
image.png4、声道数
image.png
例如立体声为 2 声道
杜比会有更多的声道
[拓展]
1、什么是杜比音效?
简单说就是多个位点收集声音信息,再通过算法整合。
从最早的杜比立体声(左右两声道)到主流的 5.1 环绕立体声再到现在最高支持 9.1
2、什么是HiFi?
HiFi 全称 High Fidelity,直译为“高保真”。说白了就是与原来的声音高度相似的重放声音。
HiFi 本质上也是相对模糊的概念,没有绝对一说。
现在出现了很多的主打音质的 HiFi 手机,比如 vivo 和 meizu
网友评论