美文网首页
讯飞科技第三方语音

讯飞科技第三方语音

作者: 箫声_筱昇 | 来源:发表于2016-04-29 21:46 被阅读261次

简单叙述语音听写;

语音听写就是将一段语音转换成文字内容,能识别常见的词汇,语句,语气并自动断句.

  • 1,创建 iOS 工程
    创建一个新的工程,或者已经打开已经建立的工程.
  • 2,添加静态库
    将在开发工具包中 lib 目录下的 iflyMSC.framework 添加到新的工程中.
    在工程的build Phases下的添加
屏幕快照 2016-04-29 下午5.19.33.png 屏幕快照 2016-04-29 下午5.19.16.png 屏幕快照 2016-04-29 下午5.23.06.png 屏幕快照 2016-04-29 下午5.22.31.png
  • 3,添加framework
    按下图添加 SDK 所需要的 iOS 库,请注意 libz.tbd,CoreTelephoney.framework 不要遗漏.
屏幕快照 2016-04-29 下午6.01.18.png
  • 4,导入头文件
//语音识别相关
#import <iflyMSC/IFlyRecognizerViewDelegate.h>
#import <iflyMSC/IFlyRecognizerView.h>
#import <iflyMSC/IFlyMS.h>
RootViewController.m
//声明一个IFlyRecognizerViewDelegate协议.这是为识别会话的服务代理
@interface RootViewController ()<IFlyRecognizerViewDelegate>
//声明一个IFlyRecognizerView的属性.
@property (nonatomic, strong) IFlyRecognizerView *recognizerView;//讯飞提供的语音识别界面
@end
//在viewDidLoad里
- (void)viewDidLoad {
    [super viewDidLoad];
    /**
     *  Appid: 5722b9a5
     */
    self.navigationItem.title = @"语音的合成";
    //设置代理,
    self.recognizerView.delegate = self;
    //设置的是当前主要的功能    iat:将语音转化为普通文本.
    [self.recognizerView setParameter:@"iat" forKey:[IFlySpeechConstant IFLY_DOMAIN]];
    //设置的是语音存储位置   语音默认保存位置
    [self.recognizerView setParameter:@"asrview.pcm" forKey:[IFlySpeechConstant ASR_AUDIO_PATH]];
//在未启动语音识别功能时,先隐藏界面.
    self.recognizerView.hidden = YES;
    
    //启动按钮(添加按钮,在点击按钮时,调用方法)
    UIButton *button = [UIButton buttonWithType:UIButtonTypeSystem];
    [button setFrame:CGRectMake(100,100, 100, 50)];
    [button setTitle:@"启动听写" forState: UIControlStateNormal];
    [button addTarget:self action:@selector(startRecoder:) forControlEvents:UIControlEventTouchUpInside];
    [self.view addSubview:button];
    //初始化 testView, 用来显示识别好的文字
    UITextView *textView = [[UITextView alloc] initWithFrame:CGRectMake(50, 250, 250, 250)];
    textView.backgroundColor = [UIColor grayColor];
    [self.view addSubview:textView];
    textView.tag = 1000;//提供表示符.
}

语音听写的代理方法

//语音转化为文字完成的时候,执行的方法
- (void)onResult:(NSArray *)resultArray isLast:(BOOL)isLast{
    
    NSLog(@"isLast:%d-----resultArray:%@",isLast,resultArray);
    //1,先将 resultArray 的第一个元素取出(字典类型)
    NSDictionary *dic = resultArray[0];
    //2,由于有用的信息在 dic 的 key 值中,所以我们一会要取出 key 值.
    NSString *jsonResult = [dic allKeys].lastObject;
    //3,解析 jsonresult, 取出语音转换好的文字
    NSString *resultString = [self transFromWithSouceString:jsonResult];
    //将文字呈现在 testView 上
    UITextView *textView = [self.view viewWithTag:1000];
    if (textView.text) {  //说明 textView 上已经有文字,那就直接拼接.
        textView.text = [NSString stringWithFormat:@"%@%@",textView.text,resultString];
    }else{//无文字,直接赋值
        textView.text = resultString;
    }
    //取消\结束转换
    [self.recognizerView cancel];
}

//语音转换为文字出错地方的代理方法
- (void)onError:(IFlySpeechError *)error{
    NSLog(@"出错了:%@",error.errorDesc);
}

将语音转换好的文字提取出来,显示在 textView上

//例如将以下文字的内容输出'' 今天的天气怎么样.''     {"sn":1,"ls":true,"bg":0,"ed":0,"ws":[{"bg":0,"cw":[{"w":" 今天 ","sc":0}]},{"bg":0,"cw":[{"w":" 的","sc":0}]},{"bg":0,"cw":[{"w":" 天气 ","sc":0}]},{"bg":0,"cw":[{"w":" 怎么样 ","sc":0}]},{"bg":0,"cw":[{"w":" 。","sc":0}]}]}
- (NSString*)transFromWithSouceString:(NSString*)sourceString{
    if (sourceString == nil) {  //如果 sourceString 不存在,就不进行数据处理.
        return @"";
    }
    
    //1.将 json 串转换为需要的字典类型.
    /**
     现将字符串转换为 NSData 类型
     */
    NSData *dataSource= [sourceString dataUsingEncoding:NSUTF8StringEncoding];
    //万一崩溃,先检查 source 是否有值
    //将data 解析为字典
    NSDictionary *dic = [NSJSONSerialization JSONObjectWithData:dataSource options:NSJSONReadingAllowFragments error:nil];
    //先取出'ws'对应的值,
    NSArray *wsArray = [dic objectForKey:@"ws"];
    
    //声明一个可变字符串,用来拼接可变字符
    NSMutableString *resultString = [[NSMutableString alloc] init];
    //遍历wsArray,取出该数组当中的所有元素(字典)
    for (NSDictionary *itemDic in wsArray) {
        //itemDic 的数据结构->{"bg":0,"cw":[{"w":" 今天 ","sc":0}]}
        /**
         *  将 itemDic 当中的 cw的值取出,该值得类型为数组.
         */
        NSArray *cwarray = [itemDic objectForKey:@"cw"];
        //遍历 cwarray,取出该数组当中的所有元素(字典);
        for (NSDictionary *cwdic in cwarray) {
            //cwdic 的数据结构为{"w":" 今天 ","sc":0}
            //1,先将 w 所对应的值取出
            NSString *wString = cwdic[@"w"];
            //将 w 的值拼接起来.拼接到 resultString 中
            [resultString appendString:wString];
        }
    }
    //将最终的字符返回
    return resultString;
}

给recognizerView写一个懒加载

#pragma mark-----懒加载
- (IFlyRecognizerView *)recognizerView{
    if (!_recognizerView) {
        _recognizerView = [[IFlyRecognizerView alloc] initWithCenter:self.view.center];
        
        [self.view addSubview:_recognizerView];
    }
    return _recognizerView;
}

button 的回调按钮的方法,在点击按钮时,开启语音识别服务.

#pragma mark-----回调按钮.
- (void)startRecoder:(UIButton*)sender{
    //启动识别服务
    [self.recognizerView start];

//让隐藏的界面展现出来
    self.recognizerView.hidden = NO;
}

相关文章

  • 讯飞科技第三方语音

    简单叙述语音听写; 语音听写就是将一段语音转换成文字内容,能识别常见的词汇,语句,语气并自动断句. 1,创建 iO...

  • 科大讯飞

    科大讯飞是一家国内语音技术做的特别好的上市企业,在安徽,叫安徽科大讯飞信息科技股份有限公司。比如语音识别,语音翻译……

  • 【OC功能】科大讯飞(一)环境搭建

    前言: 今天研究了一下第三方语音-科大讯飞 讯飞也算是国内比较老牌的语音平台了,这里就不多做解释了 主要功能实现:...

  • 语音识别

    常用平台 科大讯飞 百度语音 这篇博客以科大讯飞为例 常用功能 语音识别 语音合成 集成步骤 在科大讯飞开发平台注...

  • 算法工程师的危机

    9月20号讯飞AI同传语音造假的新闻刷爆科技圈,科大讯飞股价应声下跌3.89%(不是65.3%,标题党文章害死人)...

  • 谈谈对科大讯飞的判断

    看到科大讯飞上了美国的黑名单,美国zf也被骗了。科大讯飞根本没有科技。 科大讯飞引以为傲的语音识别,正确率不敌微信...

  • iOS原生语音识别使用的正确姿势

    语音识别技术这几年在移动App上的应用越来越广,各种第三方语音识别SDK也是层出不穷,例如科大讯飞、百度语音等,同...

  • 讯飞输入法火起来,作为输入法第二的百度很受伤

    一夜之间,讯飞输入法因为罗永浩的相声专场火了起来。10月18日锤子科技召开新品发布会,罗永浩现场大秀讯飞的语音输入...

  • react-native-xunfei-speechrecogn

    功能: 通过使用讯飞SDK实现语音听写功能。 使用步骤 一、获取appid并下载对应的SDK appid是第三方应...

  • 使用科大讯飞实现语音听写功能(自定义UI)

    最近在做语音创建日程的功能,对比了google语音,微信语音,科大讯飞后选择了讯飞云的技术来实现。这里就不介绍官方...

网友评论

      本文标题:讯飞科技第三方语音

      本文链接:https://www.haomeiwen.com/subject/bkfkrttx.html