1 数字音频基础知识#
1.1 声波###
声音始于空气中的振动,这些振动一起推动邻近的空气分子,而轻微增加空气压力。压力下的空气分子随后推动周围的空气分子,后者又推动下一组分子,依此类推。高压区域穿过空气时,在后面留下低压区域。当这些压力波的变化到达人耳时,会振动耳中的神经末梢,我们将这些振动听为声音。表示音频的可视化波形,反映空气压力波。波形中的零位线是静止时的空气压力。
1.2 波形测量###
振幅、周期、频率、相位、波长。声波相互作用,大多数情况下,各种声波会存在不同程度的异相,产生比单个波形更复杂的组合波形。声音在空气和水中是纵波,声音三要素:音调、音量、音色。音调与频率有关,音色与波形有关,音量与振幅有关。人耳可听域20Hz~20000Hz,次声波和超声波。噪波有褐噪、粉噪、白噪。
1.3 模拟音频和数字音频###
模拟音频: 正负电压。麦克风将声音压力波转换成电线中的电压变化,高压成为正电压,低压成为负电压。这些电压变化通过麦克风电线传输,可以在磁带上记录成磁
场强度的变化或在黑胶唱片上记录成沟槽大小的变化。扬声器的工作方式与麦克风相反,即通过音频录音和振动中的电压信号重新产生压力波。
数字音频: 0和1。计算机以数字方式将音频信息存储成一系列0和1。在数字存储中,原始波形被分成各个称为采样的快照。此过程通常称为数字化或采样音频,但有时称为模数转换。
1.4 采样率###
表示音频信号每秒的数字快照数。该速率决定了音频文件的频率范围。采样率越高,数字波形的形状越接近原始模拟波形。低采样率会限制可录制的频率范围,导致录音表现原始声音的效果不佳。为了重现给定频率,采样率必须至少是该频率的两倍。如CD 的采样率为每秒 44,100 个采样,可重现最高为 22,050 Hz 的频率。
采样率.png
常用采样率.png
1.5 位深度###
位深度决定动态范围。采样声波时,为每个采样指定最接近原始声波振幅的振幅值。较高的位深度可提供更多可能的振幅值,产生更大的动态范围、更低的噪声基准和更高的保真度。
位深度.png
1.6 dBFS
在数字音频中,幅度以满量程的分贝数或 dBFS 为单位测量。最大可能的振幅为 0 dBFS,所有低于该值的振幅均表示为负数。给定的 dBFS 值不直接对应于以声学 dB 为单位测量的原始声音压力级别。
1.7 音频文件的内容和大小###
硬盘中的音频文件,包含一个表示采样率和位深度的小标头,然后是一长列数字,每个采样一个数字。例如,在每秒 44,100 个采样和每采样 16 位下,一个单声道文件每秒需要 86 KB,每分钟大约 5 MB。对于具有两个声道的立体声文件,将翻倍到每分钟 10 MB。wav格式没有采取压缩算法,容量大音质好。mp3格式容量小。
1.8 Au数字化音频的方式###
audition同类专业软件有cubase、protools、nuendo。audition简单易学,可扩展性强,支持多种插件,adobe平台,前身是cool edit。录音师、混音师、母带师、拟音师,audition主要是录音和混音。Au数字化音频的过程始于空气中的压力波,麦克风将此压力波转换为电压变化。声卡将这些电压变化转换为数字采样。模拟声音变成数字音频之后,Au可以录制、编辑、处理和混合音频。ADC→DAC
2 Au工作区和设置#
2.1 查看、缩放、导航###
窗口-工作区
编辑-首选项/键盘快捷键
视图-多轨编辑器/波形编辑器/CD编辑器
编辑单个文件,使用波形编辑器;混音多个文件并将其与视频集成,使用多轨编辑器。波形编辑器使用破坏性方法,这种方法会更改音频数据,同时永久性地更改保存的文件。当转换采样率和位深度、母带处理或批处理时,这样的永久更改更可取。多轨编辑器使用非破坏性方法,这种方法是非永久性的和即时的,需要更强大的处理能力,但是会增加灵活性。当逐渐构建和重新评估多图层的音乐创作或视频原声带时,此灵活性是更可取的。可以合并破坏和非破坏性编辑以适合项目的需求,例如,如果多轨剪辑需要破坏编辑,双击它以输入波形编辑器;如果编辑的波形包含有不喜欢的最近的更改,使用“撤消”命令来恢复到前一个状态,直到保存了文件,才可应用破坏性编辑。
缩放导航器,时间轴标尺。横向和纵向缩放。
2.2 自定义工作区###
工具栏,状态栏,界面颜色、亮度和性能(首选项)
2.3 连接音频硬件###
在 Windows 中,ASIO 驱动程序支持专业声卡,MME 驱动程序通常支持标准声卡。在 Mac OS 中,CoreAudio 驱动程序既支持专业声卡又支持标准声卡。ASIO 和CoreAudio 驱动程序是首选,因为它们可提供较好的性能和较短的时延。录制音频时,也可以对其进行监控,并可在播放期间立即听到音量、声像以及效果的变化。
声卡.png
将文件通道分配给输入和输出:编辑-首选项-音频声道映射。
声卡的功能:AD和DA的转换、混音、midi、TTS。分为独立声卡、集成声卡(易受干扰)。ASIO是专业声卡驱动模式,作用是减少延迟。
声卡的构成:
话筒接头,通常是卡侬口(XLR)、大三头接头,公头和母头;
耳机接头通常是大三芯(TRS);
增益旋钮,控制输入输出音量;
幻象供电开关,电容麦需要幻象供电+48V
USB接口,连接电脑。
话筒:动圈、电容、驻极。指向性。附件有话筒架、减震架(电容麦)、防喷网。
音箱:分频器、音频放大器,2.1和5.1,技术指标有输出功率、频响范围、失真度。
3 导入、录制和播放#
3.1 创建和打开文件###
使用波形编辑器可以打开以下格式的视频文件的音频部分:AVI、DV、MOV(最多具有 32 个音频声道的文件)、MPEG-1、MPEG-4、3GPP 和 3GPP2
3.2 录制音频###
一些声卡录音时会有轻微的DC偏移,收藏夹-修复DC偏移
3.3 监控录制和播放电平###
要在录制和播放期间监控输入和输出信号的振幅,请使用电平表。电平表以 dBFS(满量程的分贝数)为单位显示信号电平,其中 0 dB 电平是发生剪切前的最大可能振幅。黄色峰值指示器保持 1.5 秒,以便确定峰值振幅。如果振幅过低,则音质会降低;如果振幅过高,将发生剪切并产生扭曲。为获得最佳声音结果,在不发生剪切的情况下尽可能录制最大声的音频。在设置录制电平时,观察电平表,并尽量将最大声峰值保持在低于 -3 dB 的黄色范围内。对于专业声卡,使用声卡提供的混音器应用程序来调整这些电平。对于标准声卡,使用 Windows 或 Mac OS 提供的混音器。
4 编辑音频文件#
4.1 波形编辑器###
波形显示x 轴衡量时间, y 轴衡量振幅。由于波形显示清晰地指出振幅变化,因此非常适合于识别声乐、鼓等的敲击变化。横轴对应采样时间(频率),纵轴对应采样位数,8bit表示每个采样点用8位二进制数字表示,还原度越高。在横轴上右键,选择时间显示格式。码率是数据传输时单位时间传送的数据位数,一般用kbps即千位每秒。
频谱显示通过其频率分量显示波形, x 轴衡量时间, y 轴衡量频率。颜色越亮表示振幅分量越大。颜色从深蓝(低振幅频率)变化到亮黄色(高振幅频率)。频谱显示非常适合于删除不想要的声音,如咳嗽声和其他伪声。“频谱显示”首选项可增强不同的细节并更好地隔离伪声。在频谱显示中工作时,可以使用“选取框选择”、“套索选择”或“画笔选择”工具在特定的频谱范围内选择音频数据。“污点修复画笔”可以最快的速度修复较小的个别音频伪声(如单独的咔哒声或爆裂声)。
对于许多编辑任务(如删除或插入音频),零交叉点是进行选择的最佳位置。在零交叉点处开始和结束的选择项会减少编辑产生听得见的爆裂声或咔哒声的机会。编辑-过零,或者横轴上右键-对齐-对齐到零交叉。
4.2 淡化###
Adobe Audition 提供三种类型的可视淡化:“线性”、“对数”、“余弦”淡化。在波形的左上角或右上角,向内拖动“淡入” 或“淡出” 控制柄,然后执行以下任一操作:对于线性淡化,完全水平拖动;对于对数淡化,上下拖动;对于余弦淡化,按住 Ctrl 键。在面板上方的增益控件中拖动旋钮或数字,直观改变振幅。两段音频交叉淡化。
4.3 标记###
便于导航。需要使用“标记”面板(“窗口”>“标记”)来定义和选择标记。选定范围后按 M 键,或单击“添加标记”按钮 。标记之间的音频可保存到新文件,用“导出音频”按钮。
播放列表是对可以按任何顺序进行播放并循环指定次数的标记范围的排列。可以在“播放列表”面板中创建播放列表。要使用文件存储播放列表,必须以 WAV 格式进行保存。
4.4 反转、翻转和静音###
“反转”效果可将音频相位反转 180 度。反转不会对个别波形产生听得见的更改,但是在组合波形时可以听到差异。例如,您可能反转已粘贴的音频,以更好地将其与现有的音频对齐。可反转立体声文件的一个声道,以校正异相录音。
“翻转”效果将从右到左翻转波形,因此它会逆向播放。翻转对创建特殊效果很有用。
创建静音,可对现有音频进行消音。要在波形编辑器或多轨编辑器中添加静音,定位当前时间指示器或选择现有音频,选择“编辑”>“插入”>“静音”,并输入秒数。
4.5 频段分离器###
频段分离器能够采用所选的音频剪辑并为其最多制作 8 个副本,且每个副本使用与原始音频不同的频段。指定的交叉频率可确定分割点。
“频率分离器”选项:
频段 设置分割点的数目。将原波形复制您所指定的次数,每个副本具有由交叉数目确定的不同频率范围。
最高 为每个频段指定最高频率。“最低”和“带宽”显示基于当前和相邻频段的最高频率值计算出的值。
比例 指定直观表示频段的所示比例。您可以选择“线性”或“对数”。
最大 FIR 滤波器大小 设置 FIR(有限脉冲响应)滤波器的最大大小,以在响应曲线上保持相位误差。
4.6 转换采样类型###
解释采样率命令能够听到音频文件在不同的采样率下听起来是什么样子。
在波形编辑器中,选择“编辑”>“解释采样率”。在文本框中输入采样率,或从列表中选择常见的采样率。虽然在Au中可使用范围从 6000 到 192,000 Hz 的采样率,但是声卡可能无法正确地播放所有速率,大多数声卡都仅支持特定的采样率。
在波形编辑器中,选择“编辑”>“转换采样类型”。从“采样率”列表中选择一个速率,或自定义速率。在“高级”部分中,拖动“质量”滑块以调整采样转换的质量。为获得最佳效果,选择“前置/后置滤波器”以防止混叠噪声。
4.7 分析相位、频率和振幅###
Au提供多种方法来分析音频。要比较任何两个声道之间的相位关系,使用“相位计”面板。要分析音调和动态范围,使用“频率分析”和“振幅统计数据”面板。波形编辑器还提供了“频谱频率显示”,可将其与上面的分析方法一起使用。
5 应用效果#
5.1 振幅和压限###
强制限幅:大幅减弱高于指定阈值的音频。通过输入增强施加限制,这是一种可提高整体音量同时避免扭曲的方法。最大振幅,设置允许的最大采样振幅。输入增强,在限制音频前对其进行预放大,在不剪切的情况下使所选音频更大声。随着该电平的增加,压缩级别也将提高。尝试极端设置以在当代流行音乐中实现大声、高冲击力的音频。预测时间,设置在达到最大声峰值之前减弱音频通常所需的时间量。释放时间,设置音频减弱向回反弹 12 dB 所需的时间。通常,默认值 100 左右的设置效果很好,可保持非常低的低音频率。如果该值过大,音频可能保持得非常安静,并且在一段时间内不会恢复到正常音量。
消除齿音:去除语音和歌声中使高频扭曲的齿音“嘶嘶”声。阈值设置振幅上限,超过此振幅将进行压缩。中心频率指定齿音最强时的频率,在播放音频时调整此设置。
频段宽度确定触发压缩器的频率范围。仅输出齿音可听到检测到的齿音。
动态处理:可用作压缩器、限制器或扩展器。作为压缩器和限制器时,此效果可减少动态范围,产生一致的音量。作为扩展器时,它通过减小低电平信号的电平来增加动态范围。动态处理效果仅产生微妙变化,在波形编辑器中应用此效果时,请使用原始文件的副本,以便在必要时可恢复到原始音频。图形沿水平标尺(x 轴)描述输入电平,沿垂直标尺(y 轴)描述新的输出电平。
标准化:设置文件或选择项的峰值电平。将音频标准化到 100% 时,可获得数字音频允许的最大振幅 0 dBFS。但是,如果要将音频发送给母带处理工程师,应将音频标准化到 -3 到 -6 dBFS 之间,为进一步处理提供缓冲。
电子管压限器、多段压限器
5.2 延迟与回声###
模拟延迟:干输出,确定原始未处理音频的电平。湿输出,确定延迟的、经过处理的音频的电平。延迟,指定延迟长度。反馈,通过延迟线重新发送延迟的音频,来创建重复回声。例如,设置为 20% 将发送原始音量五分之一的延迟音频,从而创建缓慢淡出的回声。
延迟:35 毫秒或更长时间的延迟可产生不连续的回声,而15-34毫秒之间的延迟可产生简单的和声或镶边效果。混合,设置要混合到最终输出中的经过处理的湿信号与原始的干信号的比率。设置为 50 将平均混合两种信号。反转延迟信号的相位,从而创建类似于梳状滤波器的相位抵消效果。
回声:可向声音添加一系列重复的衰减回声。可以通过改变延迟量来创建从大峡谷类型的“Hello-ello-llo-lo-o”到金属的水管叮当声等各种效果。通过均衡延迟,可以将空间的声音特性从具有反射表面(产生更清晰的回声)更改为几乎完全吸收(产生更模糊的回声)。延迟时间,指定两个回声之间的毫秒数、节拍数或采样数。回声反弹,使回声在左右声道之间来回反弹。如果想要创建来回反弹的回声,将初始回声的一个声道的音量选择为 100%,另一个选择为 0%。否则,每个声道的设置都将反弹到另一个声道,而在每个声道产生两组回声。连续回声均衡,使每个连续回声通过八频段均衡器,让您模拟房间的自然声音吸收。设置为 0 将保持频段不变,而最大设置 15 会将该频率减小 15dB。而且,由于 -15 dB 是各个连续回声的差值,某些频率将比其他频率更快消失。
5.3 滤波与均衡###
切换到频谱频率显示器,横轴为时间,纵轴为频率,红色表示该频率占得比例大。
FFT滤波器
图形均衡器
参数均衡器
科学均衡器
5.4降噪/恢复###
录音前先录一段背景噪音,获取噪音特性
效果-降噪-捕捉噪声样本-应用
曲线决定各个频段的降噪程度
高级-fft,快速傅氏变换
5.5 混响###
5.6 特殊效果###
5.7 时间与变调###
伸缩与变调
5.8 立体声声效###
中置声道提取器
图形相位调整器
5.9 VST插件###
第三方增效工具
下载dll文件放在指定文件夹
效果-音频增效工具管理器,在“VST 增效工具文件夹”部分中,单击“添加”以指定想要扫描增效工具的自定义文件夹。在“可用的增效工具”部分中,单击“扫描增效工具”。
如果第三方效果不兼容,Au会将其添加到效果菜单中的“不支持”子菜单中。
5.10主控机架###
主控机架、脚本和批处理、输入输出与发送。
五种音轨:视频、音频、midi、总线、主控
在音轨上选择输入和输出。
添加总音轨、主控。总线也可汇总到总线。类似于分组的功能
除了输出到总线,也可以发送
主控是总控制
midi音频,Musical Instrument Digital Interface乐器数字接口。文件大小比较小,只需保留声音的音调和长度,与模拟的音频文件通道不同,每个乐器一个通道。用midi键盘输入。有些版本Au不支持midi轨。
视频配音和内录,支持导入的视频格式。调出视频窗口,播放视频,进行录音。
内录:声音-录制-显示已禁用的设备-立体声混音-启用,编辑-首选项-音频硬件-默认输入-立体声混音,这时计算机在线或者本地播放的声音可以直接内录。
6 多轨会话#
多轨双击可切换到波形编辑
选中音轨右键,可合并、分组、锁定
音量包络线,声相包络线
读取改成“写入”,用“混音器”动态调节
切换到fx效果下,可分别添加效果器
7 视频和环绕声#
8 保存和导出#
指定文件名和位置,选择文件格式。设置采样率和位深度,数据压缩和存储模式。
如果想编辑或输出立体声或环绕立体声文件的各个声道,将它们提取为单声道文件。在波形编辑器中,选择编辑-将声道提取为单声道文件。大多数情况下,应当将解压缩音频保存为 AIFF 或 WAV 格式。仅当为 Web 或便携式媒体播放器创建文件时,才会保存为压缩的 mp3 格式。MP3 是用于在线发布的标准压缩音频格式。
网友评论