美文网首页
音频录制

音频录制

作者: 伯wen | 来源:发表于2016-12-23 10:24 被阅读122次

    iOS中开发录制语音的功能非常简单, 只需要使用AVFoundation库下的AVAudioRecorder即可, 是许多标准录音的首选方法

    首先, 系统默认的音频会话是<a>AVAudioSessionCategorySoloAmbient</a>, 并不支持音频输入, 所以我们需要先设置音频会话, 修改为<a>AVAudioSessionCategoryPlayAndRecord</a>

    - (BOOL)application:(UIApplication *)application didFinishLaunchingWithOptions:(NSDictionary *)launchOptions {
        AVAudioSession *session = [AVAudioSession sharedInstance];
        NSError *error;
        if (![session setCategory:AVAudioSessionCategoryPlayAndRecord error:&error]) {
            NSLog(@"Category Error: %@", [error localizedDescription]);
        }    
        if (![session setActive:YES error:&error]) {
            NSLog(@"Activation Error: %@", [error localizedDescription]);
        }
        return YES;
    }
    

    如果程序需要运行在真机上, 我们还需要在info文件中添加<a>Privacy - Microphone Usage Description</a>字段

    接下来创建AVAudioRecorder对象

    这里使用初始化方法<a>- (nullable instancetype)initWithURL:(NSURL *)url settings:(NSDictionary<NSString *, id> *)settings error:(NSError **)outError;</a>

    该方法需要传入三个参数:

    url: 第一个是语音文件需要保存的位置, 设立使用沙盒的tmp文件夹临时保存文件
    settings: 第二个是对于录制音频的一些控制设置, 例如文件的格式, 采样率, 通道数, 指定格式的键, 音频质量等
    outError: NSError指针, 当出现错误时可以使用

    这里主要讲解第二个参数<a> settings </a>

    • 音频格式: AVFormatIDKey定义了写入内容的音频格式
        kAudioFormatLinearPCM               = 'lpcm',
        kAudioFormatAC3                     = 'ac-3',
        kAudioFormat60958AC3                = 'cac3',
        kAudioFormatAppleIMA4               = 'ima4',
        kAudioFormatMPEG4AAC                = 'aac ',
        kAudioFormatMPEG4CELP               = 'celp',
        kAudioFormatMPEG4HVXC               = 'hvxc',
        kAudioFormatMPEG4TwinVQ             = 'twvq',
        kAudioFormatMACE3                   = 'MAC3',
        kAudioFormatMACE6                   = 'MAC6',
        kAudioFormatULaw                    = 'ulaw',
        kAudioFormatALaw                    = 'alaw',
        kAudioFormatQDesign                 = 'QDMC',
        kAudioFormatQDesign2                = 'QDM2',
        kAudioFormatQUALCOMM                = 'Qclp',
        kAudioFormatMPEGLayer1              = '.mp1',
        kAudioFormatMPEGLayer2              = '.mp2',
        kAudioFormatMPEGLayer3              = '.mp3',
        kAudioFormatTimeCode                = 'time',
        kAudioFormatMIDIStream              = 'midi',
        kAudioFormatParameterValueStream    = 'apvs',
        kAudioFormatAppleLossless           = 'alac',
        kAudioFormatMPEG4AAC_HE             = 'aach',
        kAudioFormatMPEG4AAC_LD             = 'aacl',
        kAudioFormatMPEG4AAC_ELD            = 'aace',
        kAudioFormatMPEG4AAC_ELD_SBR        = 'aacf',
        kAudioFormatMPEG4AAC_ELD_V2         = 'aacg',    
        kAudioFormatMPEG4AAC_HE_V2          = 'aacp',
        kAudioFormatMPEG4AAC_Spatial        = 'aacs',
        kAudioFormatAMR                     = 'samr',
        kAudioFormatAMR_WB                  = 'sawb',
        kAudioFormatAudible                 = 'AUDB',
        kAudioFormatiLBC                    = 'ilbc',
        kAudioFormatDVIIntelIMA             = 0x6D730011,
        kAudioFormatMicrosoftGSM            = 0x6D730031,
        kAudioFormatAES3                    = 'aes3',
        kAudioFormatEnhancedAC3             = 'ec-3'
    

    指定kAudioFormatLinearPCM会将未压缩的音频流写入到文件中, 这种格式的保真度最高, 不过相应的文件也最大, 比较优质的选择是kAudioFormatMPEG4AAC或kAudioFormatAppleIMA4, 压缩格式会明显的缩小文件大小, 并且能够保存高质量的音频内容

    • 采样率: AVSampleRateKey用于定义录音器的采样率

      • 采样率定义了对输入的模拟音频信号每一秒内的采样数, 在录制音频的质量及最终文件大小方面, 采样率扮演着至关重要的角色, 适用低采样率, 会导致粗粒度, 不过文件较小, 使用高采样率会得到高质量的内容, 不过文件会较大
      • 开发者尽量使用标准的采样率, 比如8000, 16000, 22050, 44100
    • 通道数: AVNumberOfChannelsKey用于定义记录音频内容的通道数

      • 取值: 1 -> 单声道录制 2 -> 立体声录制, 默认值为1
      • 除非使用外部硬件录制, 否则一般都使用单声道录音
    • 音频的质量AVEncoderAudioQualityKey

    typedef NS_ENUM(NSInteger, AVAudioQuality) {
        AVAudioQualityMin    = 0,                //最差
        AVAudioQualityLow    = 0x20,             //低等
        AVAudioQualityMedium = 0x40,             //中等
        AVAudioQualityHigh   = 0x60,             //高等
        AVAudioQualityMax    = 0x7F              //最好
    };
    

    录音初始化

    下面是语音的初始化代码

    NSString *tmpDir = NSTemporaryDirectory();
    NSString *filePath = [tmpDir stringByAppendingPathComponent:@"memo.caf"];
    NSURL *fileURL = [NSURL fileURLWithPath:filePath];
    
    NSDictionary *settings = @{
                               AVFormatIDKey : @(kAudioFormatAppleIMA4),
                               AVSampleRateKey : @44100.0f,
                               AVNumberOfChannelsKey : @1,
                               AVEncoderBitDepthHintKey : @16,
                               AVEncoderAudioQualityKey : @(AVAudioQualityMedium)
                               };
    NSError *error;
    self.recoder = [[AVAudioRecorder alloc] initWithURL:fileURL settings:settings error:&error];
    if (self.recoder) {
        self.recoder.delegate = self;
        self.recoder.meteringEnabled = YES;
        [self.recoder prepareToRecord];
    } else {
        NSLog(@"Error: %@", [error localizedDescription]);
    }
    

    录音时长

    AVAudioRecorder有一个currentTime属性, 记录当前录制音频的时长, 可以使用定时器来轮询这个值, 并展示给用户(由于录音是可以暂停, 然后可以接着继续录制, 所以使用定时器单纯的累加会造成较大的误差)

    录音开始, 暂停和停止

    - (BOOL)record;
    - (void)pause; 
    - (void)stop;
    

    当使用stop方法后, 会停止语音, 并调用代理的方法, 我们可以在这里对录制完成的文件进行处理
    <a>- (void)audioRecorderDidFinishRecording:(AVAudioRecorder *)recorder successfully:(BOOL)flag</a>

    音频测量 Audio Metering

    在上面的初始化代码中, 使用了一个属性meteringEnabled, 并设置为YES
    meteringEnabled: 主要用于音频的测量, 默认为NO, 只有设置为YES才可以进行音频测量, 当然也只有使用音频测量的时候才会设置

    AVAudioRecorder和AVAudioPlayer都可以进行音频的测量, 两个类使用的方法都是averagePowerForChannel:和peakPowerForChannel:
    两个方法都会返回一个表示声音分贝(dB)等级的浮点值, 这个值从表示最大分贝的0Db(full scale)到表示最小分贝或静音的-160dB
    在测量过程中, 每当需要读取值时, 都需要调用updateMeters方法

    相关文章

      网友评论

          本文标题:音频录制

          本文链接:https://www.haomeiwen.com/subject/xkfkvttx.html