美文网首页
3期_音频数字信号质量三要素

3期_音频数字信号质量三要素

作者: 萧修 | 来源:发表于2023-09-11 01:00 被阅读0次

    采样率

    单位时间内(1s)对声音信号的采样次数,常说的44.1kHz,也即1秒采集了44100个样本。

    采样率越高采样点越多,就可以越好表示原波形,这就是采样率的影响。

    奈奎斯特采样定理:采样率f,必须大于原始音频信号最大振动频率fmax的2倍,采样结果才能用于完整重建原始音频信号,如果采样率低于2*fmax,那么音频采样就存在失真。

    采样率的应用场景

    8kKHz:在语聊,通话场景,满足基本的沟通目的,同时有效减少数据量,兼容各种传输/存储环境,人说话频率在300~700Hz之间,最大区间一般在60Hz-200Hz

    16KHz、32HHz:保证基本的沟通,某些音频算法会采用

    44.1KHz、48KHz:在线KTV,音乐教学场景,44.1zKH作为CD音质的采样标准

    96KHz、192KHz:特殊的应用,对采集的音频进行二次合成

    采样位深

    数字化过程中有个量化概念,量化精度-位深,采样位深指的是在音频采集量化过程中,每个采样点幅度值的取值精度,一般使用bit作为单位,比如,当采样位深为8bit,则每个采样点的幅度值可以用28=256量化值表示,采样位深为16bit时,则每个采样点的幅度值可以用216=65536个量化值表示,显然,16bit笔8bit克存储,表示的数据更多,更精细,量化时产生的误差越小。

    位深影响声音的解析精度,细腻程度,我们可以理解为声音信号的分辨率,位深越大,音色越真实,生动。

    采样深度

    8bit:早期常用的位深精度,可满足基础的通话音质需求。
    16bit:被认为专业音频质量的位深标准
    24bit、32bit、64bit

    声道数

    单声道和双声道,描述一个音频信号的声道数(分别对应声道数1和2)。除此之外,PC还有4.6.8等声道的扩展。一般来说声道数越多,声音的方向感、空间感越丰富,听感也就越好。

    能够使用哪一种配置,还是由采集、播放的设备决定。

    播放:解码音频数据可以获取数据的声道数,实际播放时,获取设备的属性,如果设备支持双声道,但播放数据是单声道,就需要将单声道转双声道播放

    音频码率

    音频码率又称为比特率,指的是单位时间(1s)包含的音频数据量。

    公式为:采样率 * 位深 * 声道数 * 时长(1s)
    

    一个PCM文件时长1分钟,需要存储这个文件的数据量是多少?

    60 * 44100 * 16 * 2 * 1

    相关文章

      网友评论

          本文标题:3期_音频数字信号质量三要素

          本文链接:https://www.haomeiwen.com/subject/qexumdtx.html