声音

作者: iOS小洁 | 来源:发表于2022-12-26 17:52 被阅读0次

好声音？新声音？真声音！
好声音，声音好
声音学习：声音虚实
声音课程：美化声音
听，声音的声音
声音
声音
声音
声音
声音

一、声音

振幅（Amplitude）：从平衡位置到最大位移位置之间的距离。振幅越大，响度越大

周期（Period）：空气分子完全来回振动一次所花费的时间。

频率（Frequency）：物体每秒来回振动的次数。频率越高，音调就越高

音色（Timbre）：是指声音的特色。

二、音频数字化

将模拟信号（Analog Signal）转成数字信号（Digital Signal）后进行存储的过程

常见技术方案是脉冲编码调制（PCM，Pulse Code Modulation）

三、脉冲编码调制（PCM，Pulse Code Modulation）

过程：采样-量化-编码

采样（Sampling）

采样（Sampling）：每隔一段时间采集一次模拟信号的样本，是一个在时间上将模拟信号离散化（把连续信号转换成离散信号）的过程。

采样率（采样频率，采样速率，Sampling Rate）：每秒采集的样本数量。比如，采样率44.1kHz表示1秒钟采集44100个样本。

采样定理（奈奎斯特–香农采样定理，Nyquist-Shannon sampling theorem）得知：只有当采样率高于声音信号最高频率的2倍时，才能把采集的声音信号唯一地还原成原来的声音。人耳能够感觉到的最高声音频率为20000Hz，因此为了满足人耳的听觉要求，需要至少每秒进行40000次采样（40kHz采样率）

量化

量化（Quantization）：将每一个采样点的样本值数字化。

位深度（采样精度，采样大小，Bit Depth）：使用多少个二进制位来存储一个采样点的样本值。位深度越高，表示的振幅越精确。常见的CD采用16bit的位深度，DVD24bit,电话8bit

编码

编码：将采样和量化后的数字数据转成二进制码流。

声道（Channel）

单声道产生一组声波数据，双声道（立体声）产生两组声波数据。PCM数据大小 = 采样率 * 位深度 * 声道数 * 时间

比特率

比特率（Bit Rate），指单位时间内传输或处理的比特数量，单位是：比特每秒（bit/s或bps）

比特率（Bit Rate） = 采样率 * 位深度 * 声道数

信噪比

信噪比（Signal-to-noise ratio，SNR，S/N，讯噪比），指信号与噪声的比例，用于比较所需信号的强度与背景噪声的强度，以分贝（dB）为单位。

PCM数据大小

PCM数据大小 = 采样率 * 位深度 * 声道数 * 时间

要想在不改变音频时长的前提下，降低音频数据的大小，只有2种方法：降低采样指标、压缩。降低采样指标是不可取的，会导致音频质量下降，用户体验变差，因此专家们研发了各种压缩方案。

四、音频的编码

编码：为了更便于存储和传输，一般都会使用某种音频编码对它进行编码压缩，然后再存成某种音频文件格式。

压缩比 = 未压缩大小 / 压缩后大小

无损压缩
- 解压后可以完全还原出原始数据
- 压缩比小，体积大
有损压缩
- 解压后不能完全还原出原始数据，会丢失一部分信息
- 压缩比大，体积小
- 压缩比越大，丢失的信息就越多，还原后的信号失真就会越大
- 一般是通过舍弃原始数据中对人类听觉不重要的部分，达成压缩成较小文件的目的

五、音频的解码（Decode）

当需要播放音频时，得先解码（解压缩）出PCM数据，然后再进行播放。

六、常见压缩方式

无损

Monkey's Audio：是一种无损的音频编码和文件格式，文件扩展名为.ape，压缩率一般在55%左右。

FLAC（Free Lossless Audio Codec），是一种无损的音频编码和文件格式，文件扩展名为.flac。虽然压缩率稍有不及Monkey's Audio，但FLAC技术更先进，占用资源更低，有更多的平台及硬件产品支持FLAC。

ALAC（Apple Lossless Audio Codec），是由Apple开发的一种无损的音频编码，文件扩展名为.m4a、.caf。

有损

MP3（MPEG Audio Layer III），是非常流行的一种有损音频编码和文件格式，文件扩展名为.mp3。

第1版是：MPEG-1 Audio Layer III，属于国际标准ISO/IEC 11172-3
第2版是：MPEG-2 Audio Layer III，属于国际标准ISO/IEC 13818-3
第3版是：MPEG-2.5 Audio Layer III，并不是由MPEG官方开发的，不是公认的标准

WMA（Windows Media Audio），是由Microsoft开发的音频编码和文件格式，文件扩展名为.wma。包括4种类型：

WMA：原始的WMA编解码器，作为MP3的竞争者，属于有损音频编码
WMA Pro：支持更多声道和更高质量的音频，属于有损音频编码
WMA Lossless：属于无损音频编码
WMA Voice：属于有损音频编码

AAC（Advanced Audio Coding），是由Fraunhofer IIS、杜比实验室、AT&T、Sony、Nokia等公司共同开发的有损音频编码和文件格式，压缩比通常为18:1。

AAC被设计为MP3格式的后继产品，通常在相同的比特率下可以获得比MP3更高的声音质量，是iPhone、iPod、iPad、iTunes的标准音频格式。

AAC编码的文件扩展名主要有3种：

.acc：传统的AAC编码，使用MPEG-2 Audio Transport Stream（ADTS）容器
.mp4：使用了MPEG-4 Part 14的简化版即3GPP Media Release 6 Basic（3gp6）进行封装的AAC编码
.m4a：为了区别纯音频MP4文件和包含视频的MP4文件而由Apple公司使用的扩展名
- Apple iTunes对纯音频MP4文件采用了.m4a文件扩展名
- M4A的本质和音频MP4相同，故音频MP4文件可以直接更改文件扩展名为.m4a

Vorbis，是由Xiph.Org基金会开发的一种有损音频编码。通常以Ogg作为容器格式，所以常合称为Ogg Vorbis，文件扩展名为.ogg。

Speex，是由Xiph.Org基金会开发的一种有损音频编码和文件格式，文件扩展名为.spx。

Opus，是由Xiph.Org基金会开发的一种有损音频编码和文件格式，文件扩展名为.opus。用以取代Vorbis和Speedx。经过多次盲听测试，在任何给定的比特率下都比其他标准音频格式具有更高的质量，包括MP3、AAC。

七、文件格式

Ogg

Ogg是一种多媒体文件格式，由Xiph.Org基金会所维护，可以纳入各式各样的音视频编码（音频、视频都可以），文件扩展名常为.ogg。

Ogg常用的音频编码有：

有损压缩：Speex、Vorbis、Opus
无损压缩：FLAC
未压缩：PCM

WAV

WAV（Waveform Audio File Format），是由IBM和Microsoft开发的音频文件格式，扩展名是.wav，通常采用PCM编码，常用于Windows系统中。

WAV的文件格式如下图所示，前面有44个字节的文件头，紧跟在后面的就是音频数据（比如PCM数据）。

WAV文件格式

NumChannels：声道数
SampleRate：采样率（Hz）
ByteRate：每秒多少个字节（Byte/s）
BitsPerSample：位深度

AIFF

AIFF（Audio Interchange File Format），由Apple开发的音频文件格式，扩展名是.aiff、.aif。跟WAV一样，通常采用PCM编码，常用于Mac系统中。

网友评论

ios 开发

本文标题：声音

本文链接：https://www.haomeiwen.com/subject/zsegqdtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

声音

一、声音

二、音频数字化

三、脉冲编码调制（PCM，Pulse Code Modulation）

采样（Sampling）

量化

编码

声道（Channel）

比特率

信噪比

PCM数据大小

四、音频的编码

五、音频的解码（Decode）

六、常见压缩方式

无损

有损

七、文件格式

Ogg

WAV

AIFF

相关文章

好声音？新声音？真声音！

好声音，声音好

声音学习：声音虚实

声音课程：美化声音

听，声音的声音

声音

声音

声音

声音

声音

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

ios 开发