iOS 实时音频采集与播放

作者: 音视频直播技术专家 | 来源:发表于2017-09-18 23:38 被阅读1267次

iOS 实时音频采集与播放
iOS 实时音频采集与播放Audio Unit使用
Webrtc音频采集和播放
WebRTC 中的基本音频处理操作
iOS - 采集音视频及写入文件
AudioUnit Mac(VoiceProcessingIO)
iOS 9音频应用播放音频之播放控制暂停停止前进后退的设置
Android 音视频学习
iOS 音频-AVAudioSession
把Android 采集的音频，通过RTP推送到远程进行实时播放

前言

在iOS中有很多方法可以进行音视频采集。如 AVCaptureDevice, AudioQueue以及Audio Unit。其中 Audio Unit是最底层的接口，它的优点是功能强大，延迟低; 而缺点是学习成本高，难度大。对于一般的iOS应用程序，AVCaptureDevice和AudioQueue完全够用了。但对于音视频直播，最好还是使用 Audio Unit 进行处理，这样可以达到最佳的效果，著名的 WebRTC 就使用的 Audio Unit 做的音频采集与播放。今天我们就重点介绍一下Audio Unit的基本知识和使用。

下图是 Audio Unit在 iOS架构中所处的位置：

基本概念

在介绍 Audio Unit 如何使用之前，先要介绍一下Audio Unit的基本概念，这样更有利于我们理解对它的使用。

Audio Unit的种类

Audio Units共可分为四大类，並可细分为七种，可参考下表：

Audo Unit 的内部结构

参考下图，Audio Unit 内部结构分为两大部分，Scope 与Element。其中 scope 又分三种，分別是 input scope, output scope, global scope。而 element 则是 input scope 或 output scope 內的一部分。

Audio Unit 的输入与输出

下图是一个 I/O type 的 Audio Unit，其输入为麦克风，其输出为喇叭。这是一个最简单的Audio Unit使用范例。

ioUnit.png
The input element is element 1 (mnemonic device: the letter “I” of the word “Input” has an appearance similar to the number 1)

The output element is element 0 (mnemonic device: the letter “O” of the word “Output” has an appearance similar to the number 0)

使用流程概要

描述音频元件（kAudioUnitType_Output／kAudioUnitSubType_RemoteIO ／kAudioUnitManufacturerApple）
使用 AudioComponentFindNext(NULL, &descriptionOfAudioComponent) 获得 AudioComponent。AudioComponent有点像生产 Audio Unit 的工厂。
使用 AudioComponentInstanceNew(ourComponent, &audioUnit) 获得 Audio Unit 实例。
使用 AudioUnitSetProperty函数为录制和回放开启IO。
使用 AudioStreamBasicDescription 结构体描述音频格式，并使用AudioUnitSetProperty进行设置。
使用 AudioUnitSetProperty 设置音频录制与放播的回调函数。
分配缓冲区。
初始化 Audio Unit。
启动 Audio Unit。

初始化

初始化看起来像下面这样。我们有一个 AudioComponentInstance 类型的成员变量，它用于存储 Audio Unit。

下面的音频格式用16位表式一个采样。


#define kOutputBus 0
#define kInputBus 1
 
// ...
 
 
OSStatus status;
AudioComponentInstance audioUnit;
 
// 描述音频元件
AudioComponentDescription desc;
desc.componentType = kAudioUnitType_Output;
desc.componentSubType = kAudioUnitSubType_RemoteIO;
desc.componentFlags = 0;
desc.componentFlagsMask = 0;
desc.componentManufacturer = kAudioUnitManufacturer_Apple;
 
// 获得一个元件
AudioComponent inputComponent = AudioComponentFindNext(NULL, &desc);
 
// 获得 Audio Unit
status = AudioComponentInstanceNew(inputComponent, &audioUnit);
checkStatus(status);
 
// 为录制打开 IO
UInt32 flag = 1;
status = AudioUnitSetProperty(audioUnit, 
                              kAudioOutputUnitProperty_EnableIO, 
                              kAudioUnitScope_Input, 
                              kInputBus,
                              &flag, 
                              sizeof(flag));
checkStatus(status);
 
// 为播放打开 IO
status = AudioUnitSetProperty(audioUnit, 
                              kAudioOutputUnitProperty_EnableIO, 
                              kAudioUnitScope_Output, 
                              kOutputBus,
                              &flag, 
                              sizeof(flag));
checkStatus(status);
 
// 描述格式
audioFormat.mSampleRate         = 44100.00;
audioFormat.mFormatID           = kAudioFormatLinearPCM;
audioFormat.mFormatFlags        = kAudioFormatFlagIsSignedInteger | kAudioFormatFlagIsPacked;
audioFormat.mFramesPerPacket    = 1;
audioFormat.mChannelsPerFrame   = 1;
audioFormat.mBitsPerChannel = 16;
audioFormat.mBytesPerPacket = 2;
audioFormat.mBytesPerFrame      = 2;
 
// 设置格式
status = AudioUnitSetProperty(audioUnit, 
                              kAudioUnitProperty_StreamFormat, 
                              kAudioUnitScope_Output, 
                              kInputBus, 
                              &audioFormat, 
                              sizeof(audioFormat));
checkStatus(status);
status = AudioUnitSetProperty(audioUnit, 
                              kAudioUnitProperty_StreamFormat, 
                              kAudioUnitScope_Input, 
                              kOutputBus, 
                              &audioFormat, 
                              sizeof(audioFormat));
checkStatus(status);
 
 
// 设置数据采集回调函数
AURenderCallbackStruct callbackStruct;
callbackStruct.inputProc = recordingCallback;
callbackStruct.inputProcRefCon = self;
status = AudioUnitSetProperty(audioUnit, 
                              kAudioOutputUnitProperty_SetInputCallback, 
                              kAudioUnitScope_Global, 
                              kInputBus, 
                              &callbackStruct, 
                              sizeof(callbackStruct));
checkStatus(status);
 
// 设置声音输出回调函数。当speaker需要数据时就会调用回调函数去获取数据。它是 "拉" 数据的概念。
callbackStruct.inputProc = playbackCallback;
callbackStruct.inputProcRefCon = self;
status = AudioUnitSetProperty(audioUnit, 
                              kAudioUnitProperty_SetRenderCallback, 
                              kAudioUnitScope_Global, 
                              kOutputBus,
                              &callbackStruct, 
                              sizeof(callbackStruct));
checkStatus(status);
 
// 关闭为录制分配的缓冲区（我们想使用我们自己分配的）
flag = 0;
status = AudioUnitSetProperty(audioUnit, 
                            kAudioUnitProperty_ShouldAllocateBuffer,
                            kAudioUnitScope_Output, 
                            kInputBus,
                            &flag, 
                            sizeof(flag));
 
// 初始化
status = AudioUnitInitialize(audioUnit);
checkStatus(status);

开启 Audio Unit

OSStatus status = AudioOutputUnitStart(audioUnit);
checkStatus(status);

关闭 Audio Unit

OSStatus status = AudioOutputUnitStop(audioUnit);
checkStatus(status);

结束 Audio Unit

AudioComponentInstanceDispose(audioUnit);

录制回调

static OSStatus recordingCallback(void *inRefCon, 
                                  AudioUnitRenderActionFlags *ioActionFlags, 
                                  const AudioTimeStamp *inTimeStamp, 
                                  UInt32 inBusNumber, 
                                  UInt32 inNumberFrames, 
                                  AudioBufferList *ioData) {
 
    // TODO:
    // 使用 inNumberFrames 计算有多少数据是有效的
    // 在 AudioBufferList 里存放着更多的有效空间
 
    AudioBufferList *bufferList; //bufferList里存放着一堆 buffers, buffers的长度是动态的。  
    
    // 获得录制的采样数据
 
    OSStatus status;
 
    status = AudioUnitRender([audioInterface audioUnit], 
                             ioActionFlags, 
                             inTimeStamp, 
                             inBusNumber, 
                             inNumberFrames, 
                             bufferList);
    checkStatus(status);
 
    // 现在，我们想要的采样数据已经在bufferList中的buffers中了。
    DoStuffWithTheRecordedAudio(bufferList);
    return noErr;
}

播放回调

static OSStatus playbackCallback(void *inRefCon, 
                                  AudioUnitRenderActionFlags *ioActionFlags, 
                                  const AudioTimeStamp *inTimeStamp, 
                                  UInt32 inBusNumber, 
                                  UInt32 inNumberFrames, 
                                  AudioBufferList *ioData) {    
    // Notes: ioData 包括了一堆 buffers 
    // 尽可能多的向ioData中填充数据，记得设置每个buffer的大小要与buffer匹配好。
    return noErr;
}

结束

Audio Unit可以做很多非常棒的的工作。如混音，音频特效，录制等等。它处于 iOS 开发架构的底层，特别合适于音视频直播这种场景中使用。

我们今天介绍的只是 Audio Unit众多功能中的一小点知识，但这一点点知识对于我来说已经够用了。对于那些想了解更多Audio Unit的人，只好自行去google了。

“知识无穷尽，只取我所需”。这就是我的思想，哈！

希望大家 多多观注！

iOS 实时音频采集与播放
前言在iOS中有很多方法可以进行音视频采集。如 AVCaptureDevice, AudioQueue以及Aud...
iOS 实时音频采集与播放Audio Unit使用
前言在iOS中有很多方法可以进行音视频采集。如 AVCaptureDevice, AudioQueue以及Aud...
Webrtc音频采集和播放
一：音频采集和播放音频的采集和播放使用模块AudioDeviceModule，定义在modules/audio_...
WebRTC 中的基本音频处理操作
在 RTC，即实时音视频通信中，要解决的音频相关的问题，主要包括如下这些：音频数据的采集及播放。音频数据的处理...
iOS - 采集音视频及写入文件
�音视频采集包括两部分：视频采集和音频采集。在iOS中可以同步采集视频与音频，通过系统框架AVFoundation...
AudioUnit Mac(VoiceProcessingIO)
最近要支持MAC版的音频采集与播放，所以需要把IOS上现有的AudioUnit代码进行移植。虽然文档里说MAC支持...
iOS 9音频应用播放音频之播放控制暂停停止前进后退的设置
iOS 9音频应用播放音频之播放控制暂停停止前进后退的设置ios9音频应用播放控制在“iOS 9音频应用播放音频之...
Android 音视频学习
概述音频的采集与播放视频的采集与渲染MediaCodec 硬编解码MediaCodec 硬编 aac 参考音视频...
iOS 音频-AVAudioSession
AVAudioSession 概述最近在做 webrtc 采集与播放音频，使用AVAudioSession进行播...
把Android 采集的音频，通过RTP推送到远程进行实时播放
主要步骤通过AudioRecord采集音频数据把采集的音频写入文件通过AudioTrack进行播放把采集的数...

网友评论

大胖_康:前辈,有没有Demo呢?按照这个写了一遍,获取不到音频的数据
音视频直播技术专家:@大胖_康随手就找了一下呀！https://github.com/lym-ay/AudioUnitRecordDemo.git
大胖_康:@音视频直播技术专家 ,谢谢,之前找了好久没找到
音视频直播技术专家:@大胖_康电脑之前的坏了，可以去 github上找相关的例子，到处都是哈
爱上我们的微笑:前辈 checkStatus(status); 方法在哪里定义的呢？
爱上我们的微笑:在这里找到了答案：http://blog.sina.com.cn/s/blog_942d71bb0102w9sg.html
8f64fc6e6524:博主你好，请问一下在录制回调，ioData 一直为空是什么情况？
音视频直播技术专家:@kotercy 需要在回调时构建 buffer、bufferlist获到数据，而不是通过 ioData获取
那幽:博主你好，在“拉”数据那里，“speaker需要数据时”这个时间是如何确定的？
音视频直播技术专家:@那幽如果播放速度比音频收到的快，那就阻塞了，也就是没声音，你可以做个测试，验证一下
那幽:@音视频直播技术专家谢博主，还有一个问题就是如果播放的速度和数据到达的速度不一致的话会出问题的吧：播放速度慢的话就会导致buffer变的越来越大，播放速度快的话就会拉取不到数据，还是说播放和数据到达的速率始终可以保持一致？
音视频直播技术专家:@那幽 speak 播完数据后，会主动调回调函数要数据

iOS 实时音频采集与播放

前言

基本概念

使用流程概要

初始化

开启 Audio Unit

关闭 Audio Unit

结束 Audio Unit

录制回调

播放回调

结束

相关文章

iOS 实时音频采集与播放

iOS 实时音频采集与播放Audio Unit使用

Webrtc音频采集和播放

WebRTC 中的基本音频处理操作

iOS - 采集音视频及写入文件

AudioUnit Mac(VoiceProcessingIO)

iOS 9音频应用播放音频之播放控制暂停停止前进后退的设置

Android 音视频学习

iOS 音频-AVAudioSession

把Android 采集的音频，通过RTP推送到远程进行实时播放

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

iOS

ios开发进阶

音视频直播技术

ios视频直播

码农的世界

程序员

WebRTC

首页投稿（暂停使用，暂停投稿）