美文网首页
AVFoundation--文字转语音

AVFoundation--文字转语音

作者: MrFire_ | 来源:发表于2017-09-07 22:13 被阅读270次

    iOS自带文字转语音功能,实现很简单,接下来我们就一起来学习这个简单酷炫的功能。

    要实现文字转语音,我们只需要简单的几个类,从本文你将学到:

    • 将文字(汉语、英语等)转化为语音输出
    • 掌握语音合成器:AVSpeechSynthesizer
      语言设置:AVSpeechSynthesisVoice
      发声对象:AVSpeechUtterance的使用
    • 文字转语音demo

    其合成过程如下:由AVSpeechSynthesisVoice设置语言环境,AVSpeechUtterance设置需要转化的文字,并对语速、音调、音量等进行控制,最后由AVSpeechSynthesizer来进行播放。

    • AVSpeechSynthesisVoice

    • 1、创建语言环境
    //参数为需要设置的语言
    AVSpeechSynthesisVoice *voice = [AVSpeechSynthesisVoice voiceWithLanguage:@"zh-TW"];
    //获取当前设置的语言
    [AVSpeechSynthesisVoice currentLanguageCode];
    
    • 2、获取支持的语言
    //通过如下方法可以查看所支持的语言,可根据需要从中选取所需语言
    NSArray *voices =  [AVSpeechSynthesisVoice speechVoices];
    常用语言如下:
         en-GB//英语(英式)
         en-US//英语(美式)
         zh-CN//汉语(普通话)
         zh-HK//汉语(粤语)
         zh-TW//汉语(台湾)
    
    • AVSpeechUtterance

    // 创建语音合成器
        AVSpeechSynthesizer *synthesizer = [[AVSpeechSynthesizer alloc] init];
        
        // 实例化发声的对象
        AVSpeechUtterance *utterance = [AVSpeechUtterance speechUtteranceWithString:@"我有一只小毛驴"];
        //语言,为AVSpeechSynthesisVoice的一个对象
        utterance.voice = voice;    
        //语速,0~1
        utterance.rate = 0.5;
        //声音,0~1
        utterance.volume = 1;
        //音调0.5~2
        utterance.pitchMultiplier = 1;
        //播放前的延时
        utterance.preUtteranceDelay = 3;
        //播放后的延时,一般用于设置连续播放多段文字的间隔
        utterance.postUtteranceDelay = 1;
    
    
    • AVSpeechSynthesizer

      1. 使用
    AVSpeechSynthesizer *synthesizer = [[AVSpeechSynthesizer alloc] init];
    //播放
    [synthesizer speakUtterance:utterance];
    
      1. 方法介绍
    //开始播放
    - (void)speakUtterance:(AVSpeechUtterance *)utterance;
    //停止播放,调用此方法会立刻停止,并清空utterance队列
    - (BOOL)stopSpeakingAtBoundary:(AVSpeechBoundary)boundary;
    //暂停播放
    - (BOOL)pauseSpeakingAtBoundary:(AVSpeechBoundary)boundary;
    //继续播放
    - (BOOL)continueSpeaking;
    

    需要说明的是调用speakUtterance:方法时其实是把utterance添加到播放队列,synthesizer会从该队列里面顺序取出utterance逐个播放,也就是我们可以一次性添加多个utterance,播放时则会顺序播放。

    • 3.代理方法,如有需要可以在代理 房中做一些处理
    - (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didStartSpeechUtterance:(AVSpeechUtterance *)utterance {
        NSLog(@"开始:%@",utterance.speechString);
    }
    - (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didPauseSpeechUtterance:(AVSpeechUtterance *)utterance {
        NSLog(@"暂停:%@",utterance.speechString);
    }
    - (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didCancelSpeechUtterance:(AVSpeechUtterance *)utterance {
        NSLog(@"取消:%@",utterance.speechString);
    }
    - (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer willSpeakRangeOfSpeechString:(NSRange)characterRange utterance:(AVSpeechUtterance *)utterance {
        NSLog(@"将要开始:%@",utterance.speechString);
    }
    - (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didContinueSpeechUtterance:(AVSpeechUtterance *)utterance {
        NSLog(@"继续:%@",utterance.speechString);
    }
    - (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didFinishSpeechUtterance:(AVSpeechUtterance *)utterance {
        NSLog(@"完成:%@",utterance.speechString);
    }
    

    写了一个简单的demo测试了一下,demo中仅有两个类,FireSpeecher用于播放控制,FireVoiceModely用于设置需要播放低文字及相关属性的配置:
    1 FireSpeecher类:

    typedef NS_ENUM(NSInteger, PauseType) {
        PauseTypeImmediate,//立刻停止
        PauseTypeByWord//读完本字(单词)后再停止
    };
    
    @interface FireSpeecher : NSObject
    
    /**
     暂停或者停止类型
     */
    @property (nonatomic, assign) PauseType pauseType;
    
    /**
     初始化
    
     @param models 需要转化的文字Model
     @return FireSpeecher对象
     */
    - (instancetype)initWithModels:(NSArray <FireVoiceModel *>*)models;
    
    /**
    播放
    
     @return YES-->播放成功,NO-->播放失败
     */
    - (BOOL)speech;
    
    /**
     暂停播放
     
     @return YES-->暂停成功,NO-->暂停失败
     */
    - (BOOL)pausedSpeech;
    
    /**
     停止
     
     @return YES-->停止成功,NO-->停止失败
     */
    - (BOOL)stopeSpeech;
    /**
     继续播放
     
     @return YES-->继续播放成功,NO-->继续播放失败
     */
    - (BOOL)contiueSpeech;
    

    2 FireVoiceModel类:

    typedef NS_ENUM(NSInteger, LanguageType) {
      LanguageTypeDefault,//默认(普通话)
      LanguageTypeCH,//中文(普通话)
      LanguageTypeHK,//香港(粤语)
      LanguageTypeTW,//中文(台湾)
      LanguageTypeUS,//英语(美式)
      LanguageTypeEN//英语(英式)
    };
    
    @interface FireVoiceModel : NSObject
    
    /**
    要说的句子
    */
    @property (nonatomic , copy) NSString *string;
    
    /**
    语言类型
    */
    @property (nonatomic, assign) LanguageType languageType;
    
    /**
    说话速率,0~1,默认0.5
    */
    @property (nonatomic, assign) CGFloat rate;
    
    /**
    音调,0.5~2.0,默认1.0
    */
    @property (nonatomic, assign) CGFloat pinch;
    
    /**
    音量,0~1,默认为1
    */
    @property (nonatomic, assign) CGFloat volume;
    
    /**
    说话前的时间,默认为0
    */
    @property (nonatomic, assign) NSTimeInterval preDelay;
    
    /**
    说话后的延时时间,默认为0
    */
    @property (nonatomic, assign) NSTimeInterval postDelay;
    

    使用就很简单了,语言默认中文普通话,包括语速、音调可以在model中对每句话单独进行设置:

    NSMutableArray *array = [NSMutableArray arrayWithCapacity:5];
        for (int i = 0; i < 5; i ++) {
            FireVoiceModel *model = [[FireVoiceModel alloc] init];
            model.string = @"哈哈";
            model.postDelay = 1;
            [array addObject:model];
        }
        FireSpeecher *speecher = [[FireSpeecher alloc] initWithModels:array];
        if ([speecher speech]) {
            NSLog(@"开讲啦");
        }else {
            NSLog(@"出错啦");
        }
    

    Demo地址

    相关文章

      网友评论

          本文标题:AVFoundation--文字转语音

          本文链接:https://www.haomeiwen.com/subject/bygbjxtx.html