音频学习:
声波三要素:频率,振幅,波形。
频率:音阶的高低
振幅:响度
波形:音色
频率
频率越高,波长起短,低频的声波更容易障过障碍物,声音传播越远
响度,能量的反馈,分贝来描述响度
音色,
模拟信号数字化的过程,分别是采样,量化和编码
音频采样
在时间轴上对信号进行数字化
44.1kHZ表示1秒会采样441000次
量化
在幅度轴上对信号进行数字化,简单来说就是声音波形的数据是多少位的二进制数据,通常用bit做单位,
编码
按照一定格式记录采样和量化后的数据
音频编码格式有多种,通常所说的音频裸数指的是脉冲编码调制PCM数据.
如果想要描述一份PCM数据需要(量化格式,采样这,声道数)
CD为例,量化16bite,采样率441000,声道数为2
比特率:44100 * 16 * 2 = 1378.125kbps
一分钟占用内存:1378.125 * 60 /8/1024 = 10.09MB
二、音频编码
如果按CD音质进行采样,各个角度来说都太大了,所以我们需要进行压缩编码
压缩编码的可能性
压缩编码的基本指标就是压缩比,
压缩算法分2种,有损压缩和无损压缩
无损:解压后可以完全复原
有损,解压后不能完全复原,会丢失一部分信息。压缩比越小,丢失的信息就越多,信号还原的失真就会越大
压缩编码的原理实际上就是压缩冗余的信号。冗余信号就是指不能被人耳感知的信号。包括人耳听觉范围外的音频信号以及被掩盖掉的音频信号
常用的压缩编码格式
WAV编码
WAV编码的一种实现方式。就是在源PCM数据格式前面加上44个字节。分别用来描述PCM的采样率,声道数,数据格式等信息
特点:音质非常好,大量软件都支持其播放
适用场合:多媒体开发的中间文件,保存音乐和音效素材
MP3编码
MP3编码具有不错的压缩比,听感接近WAV,在不同的环境下,调整参数可达更好效果
特点:音质在128Kbit/s以上表现不错,压缩比比较高。大量软件硬件都支持,兼容性高
适用场合:高比特率下对兼容性有要求的音乐欣赏
AAC编码
AAC是目前比较热门的有损压缩编码技术,并且衍生了LC-AAC,HE-AAC,HE-AAC v2 三个主要编码格式
LC-ACC:比较传统的AAC,主要应用于中高码率的场景编码(>= 80kbit/s)
HE-AAC:主要应用于低码率场景(<=48Kbit/s)
特点:在小于128Kbit/s的码率下表示优异,多用于视频中的音频编码
适用场合:于128kbit/s以下的音频编码,多用于视频中的音频轨的编码
编码中软编码和硬编码的区别?
硬编码:使用非CPU进行编码,使用使用GPU芯片处理
软编码:使用CPU进行编码计算
区分
软编码:实现直接、简单,参数调整方便,升级易,但CPU负载重,性能较硬编码低,低码率下质量通常比硬编码要好一点
硬编码:性能高,低码率下通常低于硬编码,但部分产品在GPU硬件平台移植了优秀的软件 编码算法如X264,质量基本等同于软编码
硬编码,就是使用GPU计算,获取数据结果,优点速度快,效率高.
软编码,就是通过CPU来计算,获取数据结果.
网友评论