消除冗余信息
- 音频压缩技术是保证信号在听觉方面不产生失真的前提下,对音频数据信号进行尽可能大的压缩
- 压缩的主要方法是去除采集到的音频冗余信息,所谓冗余信息包括人耳听觉范围外的音频信息以及被掩蔽掉的音频信号
- 信号的遮蔽可以分为 频域遮蔽和 时域遮蔽
- 人能感知的声音是20HZ-20KHZ, 在这个范围之外的声音人都无法感知
无损压缩
- 熵编码
1.1 哈夫曼编码
1.2 算数编码
1.3 香农编码
音频编码过程

常见的音频编解码器
- 常见的音频编解码器包括OPUS 、AAC、Ogg、SpeeX、 ILBC、AMR、G.711等
- 最常用的是OPUS 和AAC,其中AAC应用最广泛
- 网络评测结果 OPUS >AAC > Ogg
AAC
AAC介绍
- AAC(Advanced Audio Coding)由Fraunhofer IIS、对比实验室、AT&T、Sony等公司共同开发、目的是取代MP3格式
- 最开始是基于MPEG-2的音频编码技术,MPEG-4标准出现后,AAC重新集成了其特性,加入了SBR技术和PS技术
-
目前常用的规格有AAC LC、AAC HE V1、AAC HE V2
image.png
AAC 规格描述
- AAC LC:Low Complexity 低复杂度规格,码流是128K,音质好
- AAC HE:等于 AAC LC + SBR(spectral Band Replication)其核心思想是按频谱分保存。3. 低频编码保存主要成分,高频单独放大编码保存音质,码流在64K左右
- AAC HE V2:等于AAC LC + SBR+PS(Parametric Stereo)其核心思想是双声道中的声音存在某种相似性,只需存储一个声道的全部信息,然后,花很少的字节用参数描述另一个声道和它不同的地方
AAC头格式
- ADIF(Audio Data Interchange Formart)
这种格式的特征是可以确定的找到这个音频数据的开始,只能从头开始解码,不能在音频数据流中间开始,这种格式用在磁盘文件中 - ADTS(Audio Data Transport Stream)
这种格式的特征是每一帧都有一个同步字,所以可以在音频流的任何位置开始解码,它类似于数据流格式(运用更广)
网友评论