美文网首页
音频录制

音频录制

作者: 伯wen | 来源:发表于2016-12-23 10:24 被阅读122次

iOS中开发录制语音的功能非常简单, 只需要使用AVFoundation库下的AVAudioRecorder即可, 是许多标准录音的首选方法

首先, 系统默认的音频会话是<a>AVAudioSessionCategorySoloAmbient</a>, 并不支持音频输入, 所以我们需要先设置音频会话, 修改为<a>AVAudioSessionCategoryPlayAndRecord</a>

- (BOOL)application:(UIApplication *)application didFinishLaunchingWithOptions:(NSDictionary *)launchOptions {
    AVAudioSession *session = [AVAudioSession sharedInstance];
    NSError *error;
    if (![session setCategory:AVAudioSessionCategoryPlayAndRecord error:&error]) {
        NSLog(@"Category Error: %@", [error localizedDescription]);
    }    
    if (![session setActive:YES error:&error]) {
        NSLog(@"Activation Error: %@", [error localizedDescription]);
    }
    return YES;
}

如果程序需要运行在真机上, 我们还需要在info文件中添加<a>Privacy - Microphone Usage Description</a>字段

接下来创建AVAudioRecorder对象

这里使用初始化方法<a>- (nullable instancetype)initWithURL:(NSURL *)url settings:(NSDictionary<NSString *, id> *)settings error:(NSError **)outError;</a>

该方法需要传入三个参数:

url: 第一个是语音文件需要保存的位置, 设立使用沙盒的tmp文件夹临时保存文件
settings: 第二个是对于录制音频的一些控制设置, 例如文件的格式, 采样率, 通道数, 指定格式的键, 音频质量等
outError: NSError指针, 当出现错误时可以使用

这里主要讲解第二个参数<a> settings </a>

  • 音频格式: AVFormatIDKey定义了写入内容的音频格式
    kAudioFormatLinearPCM               = 'lpcm',
    kAudioFormatAC3                     = 'ac-3',
    kAudioFormat60958AC3                = 'cac3',
    kAudioFormatAppleIMA4               = 'ima4',
    kAudioFormatMPEG4AAC                = 'aac ',
    kAudioFormatMPEG4CELP               = 'celp',
    kAudioFormatMPEG4HVXC               = 'hvxc',
    kAudioFormatMPEG4TwinVQ             = 'twvq',
    kAudioFormatMACE3                   = 'MAC3',
    kAudioFormatMACE6                   = 'MAC6',
    kAudioFormatULaw                    = 'ulaw',
    kAudioFormatALaw                    = 'alaw',
    kAudioFormatQDesign                 = 'QDMC',
    kAudioFormatQDesign2                = 'QDM2',
    kAudioFormatQUALCOMM                = 'Qclp',
    kAudioFormatMPEGLayer1              = '.mp1',
    kAudioFormatMPEGLayer2              = '.mp2',
    kAudioFormatMPEGLayer3              = '.mp3',
    kAudioFormatTimeCode                = 'time',
    kAudioFormatMIDIStream              = 'midi',
    kAudioFormatParameterValueStream    = 'apvs',
    kAudioFormatAppleLossless           = 'alac',
    kAudioFormatMPEG4AAC_HE             = 'aach',
    kAudioFormatMPEG4AAC_LD             = 'aacl',
    kAudioFormatMPEG4AAC_ELD            = 'aace',
    kAudioFormatMPEG4AAC_ELD_SBR        = 'aacf',
    kAudioFormatMPEG4AAC_ELD_V2         = 'aacg',    
    kAudioFormatMPEG4AAC_HE_V2          = 'aacp',
    kAudioFormatMPEG4AAC_Spatial        = 'aacs',
    kAudioFormatAMR                     = 'samr',
    kAudioFormatAMR_WB                  = 'sawb',
    kAudioFormatAudible                 = 'AUDB',
    kAudioFormatiLBC                    = 'ilbc',
    kAudioFormatDVIIntelIMA             = 0x6D730011,
    kAudioFormatMicrosoftGSM            = 0x6D730031,
    kAudioFormatAES3                    = 'aes3',
    kAudioFormatEnhancedAC3             = 'ec-3'

指定kAudioFormatLinearPCM会将未压缩的音频流写入到文件中, 这种格式的保真度最高, 不过相应的文件也最大, 比较优质的选择是kAudioFormatMPEG4AAC或kAudioFormatAppleIMA4, 压缩格式会明显的缩小文件大小, 并且能够保存高质量的音频内容

  • 采样率: AVSampleRateKey用于定义录音器的采样率

    • 采样率定义了对输入的模拟音频信号每一秒内的采样数, 在录制音频的质量及最终文件大小方面, 采样率扮演着至关重要的角色, 适用低采样率, 会导致粗粒度, 不过文件较小, 使用高采样率会得到高质量的内容, 不过文件会较大
    • 开发者尽量使用标准的采样率, 比如8000, 16000, 22050, 44100
  • 通道数: AVNumberOfChannelsKey用于定义记录音频内容的通道数

    • 取值: 1 -> 单声道录制 2 -> 立体声录制, 默认值为1
    • 除非使用外部硬件录制, 否则一般都使用单声道录音
  • 音频的质量AVEncoderAudioQualityKey

typedef NS_ENUM(NSInteger, AVAudioQuality) {
    AVAudioQualityMin    = 0,                //最差
    AVAudioQualityLow    = 0x20,             //低等
    AVAudioQualityMedium = 0x40,             //中等
    AVAudioQualityHigh   = 0x60,             //高等
    AVAudioQualityMax    = 0x7F              //最好
};

录音初始化

下面是语音的初始化代码

NSString *tmpDir = NSTemporaryDirectory();
NSString *filePath = [tmpDir stringByAppendingPathComponent:@"memo.caf"];
NSURL *fileURL = [NSURL fileURLWithPath:filePath];

NSDictionary *settings = @{
                           AVFormatIDKey : @(kAudioFormatAppleIMA4),
                           AVSampleRateKey : @44100.0f,
                           AVNumberOfChannelsKey : @1,
                           AVEncoderBitDepthHintKey : @16,
                           AVEncoderAudioQualityKey : @(AVAudioQualityMedium)
                           };
NSError *error;
self.recoder = [[AVAudioRecorder alloc] initWithURL:fileURL settings:settings error:&error];
if (self.recoder) {
    self.recoder.delegate = self;
    self.recoder.meteringEnabled = YES;
    [self.recoder prepareToRecord];
} else {
    NSLog(@"Error: %@", [error localizedDescription]);
}

录音时长

AVAudioRecorder有一个currentTime属性, 记录当前录制音频的时长, 可以使用定时器来轮询这个值, 并展示给用户(由于录音是可以暂停, 然后可以接着继续录制, 所以使用定时器单纯的累加会造成较大的误差)

录音开始, 暂停和停止

- (BOOL)record;
- (void)pause; 
- (void)stop;

当使用stop方法后, 会停止语音, 并调用代理的方法, 我们可以在这里对录制完成的文件进行处理
<a>- (void)audioRecorderDidFinishRecording:(AVAudioRecorder *)recorder successfully:(BOOL)flag</a>

音频测量 Audio Metering

在上面的初始化代码中, 使用了一个属性meteringEnabled, 并设置为YES
meteringEnabled: 主要用于音频的测量, 默认为NO, 只有设置为YES才可以进行音频测量, 当然也只有使用音频测量的时候才会设置

AVAudioRecorder和AVAudioPlayer都可以进行音频的测量, 两个类使用的方法都是averagePowerForChannel:和peakPowerForChannel:
两个方法都会返回一个表示声音分贝(dB)等级的浮点值, 这个值从表示最大分贝的0Db(full scale)到表示最小分贝或静音的-160dB
在测量过程中, 每当需要读取值时, 都需要调用updateMeters方法

相关文章

网友评论

      本文标题:音频录制

      本文链接:https://www.haomeiwen.com/subject/xkfkvttx.html