音频的格式与编码

作者: 小蒋不素小蒋 | 来源:发表于2018-08-11 10:12 被阅读0次

    一、前言


    音频文件通常分为两类:

    声音文件:通过声音录入设备录制的原始声音,直接记录了真实声音的二进制采样数据,通常文件较大

    MIDI 文件 一种音乐演奏指令序列,相当于乐谱,可以利用声音输出设备或与计算机相连的电子乐器进行演奏,由于不包含声音数据,其文件尺寸较小

    二、无损 & 有损


    那声音文件同样也分为两类:

    • 无损格式
    • 有损格式

    无损格式:只是对源声音文件进行无损压缩而已

    有损文件:一是去掉人耳听不到的声音,频率在 20HZ 到 20KHZ 之外;二是基于声学心理学的模型,除去人类很难或根本分辨不出的声音,例如:一个音量很高的声音后面紧跟着一个音量很低的声音

    格式 公司 类型 备注
    CD 飞利浦 + 索尼 无损 音质最佳
    FLAC 开源,隶属 Ogg 无损
    APE 开源 无损
    WAV 微软 无损
    AIFF 苹果 无损
    RA / RM / RAM realplay 有损
    MP3 MPEG 有损
    AAC MPEG 有损

    注1:AAC 格式:新时代的有损压缩王者,跟 MP3 比 AAC 格式的音质更佳,文件更小,正慢慢取代 MP3 中。比如著名的 H.264 视频压缩格式,基于它的视频文件普遍挂载的就是 AAC 格式的音轨。

    image.png

    注2:FLAC 是现在网上最流行的无损格式。

    注3:假无损:以有损的音源无损转换之后的文件,带着无损的面纱,长着有损的脸。
    例如网上很多人反映网易云音乐的无损音乐是挂羊头卖狗肉,是利用频谱软件观察发现了端倪,

    三、关键参数


    1、Sample Rate - 采样率


    image.png

    我们以怎样的频率记录声音波形的变化(类似视频中的24帧

    44.1KHz,意味着每秒选取 44100 个采样点;48KHz 意味着每秒选取 48000 个采样点

    一般认为 44.1KHz 就接近人耳极限了

    现在所有音频格式(从 CD 到MP3)一律采用 44.1KHz,而 DVD/BD 视频音轨一律采用 48KHz。

    image.png

    2、位深度


    我们用多少字节的储存量来储存音频波形(类似视频的分辨率

    一般采用的是 16bit,及更高的 24bit,再高的深度意义不大

    3、bit rate - 码率


    image.png

    码率就是数据传输时单位时间传送的数据位数,一般我们用的单位是 kbps 即千位每秒。

    码率 = 采样率 * 位深度

    所以评判音质,可以直接看码率就好

    image.png

    4、声道数


    image.png

    例如立体声为 2 声道

    杜比会有更多的声道


    [拓展]

    1、什么是杜比音效?

    简单说就是多个位点收集声音信息,再通过算法整合。

    从最早的杜比立体声(左右两声道)到主流的 5.1 环绕立体声再到现在最高支持 9.1

    2、什么是HiFi?

    HiFi 全称 High Fidelity,直译为“高保真”。说白了就是与原来的声音高度相似的重放声音。

    HiFi 本质上也是相对模糊的概念,没有绝对一说。

    现在出现了很多的主打音质的 HiFi 手机,比如 vivo 和 meizu

    相关文章

      网友评论

        本文标题:音频的格式与编码

        本文链接:https://www.haomeiwen.com/subject/mnerbftx.html