音频的格式与编码

作者: 小蒋不素小蒋 | 来源:发表于2018-08-11 10:12 被阅读0次

一、前言

音频文件通常分为两类：

声音文件：通过声音录入设备录制的原始声音，直接记录了真实声音的二进制采样数据，通常文件较大

MIDI 文件 一种音乐演奏指令序列，相当于乐谱，可以利用声音输出设备或与计算机相连的电子乐器进行演奏，由于不包含声音数据，其文件尺寸较小

二、无损 & 有损

那声音文件同样也分为两类：

无损格式
有损格式

无损格式：只是对源声音文件进行无损压缩而已

有损文件：一是去掉人耳听不到的声音，频率在 20HZ 到 20KHZ 之外；二是基于声学心理学的模型，除去人类很难或根本分辨不出的声音，例如：一个音量很高的声音后面紧跟着一个音量很低的声音

格式	公司	类型	备注
CD	飞利浦 + 索尼	无损	音质最佳
FLAC	开源，隶属 Ogg	无损
APE	开源	无损
WAV	微软	无损
AIFF	苹果	无损
RA / RM / RAM	realplay	有损
MP3	MPEG	有损
AAC	MPEG	有损

注1：AAC 格式：新时代的有损压缩王者，跟 MP3 比 AAC 格式的音质更佳，文件更小，正慢慢取代 MP3 中。比如著名的 H.264 视频压缩格式，基于它的视频文件普遍挂载的就是 AAC 格式的音轨。

image.png

注2：FLAC 是现在网上最流行的无损格式。

注3：假无损：以有损的音源无损转换之后的文件，带着无损的面纱，长着有损的脸。
例如网上很多人反映网易云音乐的无损音乐是挂羊头卖狗肉，是利用频谱软件观察发现了端倪，

三、关键参数

1、Sample Rate - 采样率

image.png

我们以怎样的频率记录声音波形的变化（类似视频中的24帧）

44.1KHz，意味着每秒选取 44100 个采样点；48KHz 意味着每秒选取 48000 个采样点

一般认为 44.1KHz 就接近人耳极限了

现在所有音频格式（从 CD 到MP3）一律采用 44.1KHz，而 DVD/BD 视频音轨一律采用 48KHz。

image.png

2、位深度

我们用多少字节的储存量来储存音频波形（类似视频的分辨率）

一般采用的是 16bit，及更高的 24bit，再高的深度意义不大

3、bit rate - 码率

image.png

码率就是数据传输时单位时间传送的数据位数，一般我们用的单位是 kbps 即千位每秒。

码率 = 采样率 * 位深度

所以评判音质，可以直接看码率就好

image.png

4、声道数

image.png

例如立体声为 2 声道

杜比会有更多的声道

[拓展]

1、什么是杜比音效？

简单说就是多个位点收集声音信息，再通过算法整合。

从最早的杜比立体声（左右两声道）到主流的 5.1 环绕立体声再到现在最高支持 9.1

2、什么是HiFi？

HiFi 全称 High Fidelity，直译为“高保真”。说白了就是与原来的声音高度相似的重放声音。

HiFi 本质上也是相对模糊的概念，没有绝对一说。

现在出现了很多的主打音质的 HiFi 手机，比如 vivo 和 meizu

网友评论

本文标题：音频的格式与编码

本文链接：https://www.haomeiwen.com/subject/mnerbftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

音频的格式与编码

一、前言

二、无损 & 有损

三、关键参数

1、Sample Rate - 采样率

2、位深度

3、bit rate - 码率

4、声道数

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

计算机微刊

电脑知识