美文网首页
API 百度 语音识别功能踩坑(菜鸟版)

API 百度 语音识别功能踩坑(菜鸟版)

作者: x8q7 | 来源:发表于2018-05-25 11:59 被阅读0次

    本文结合内容,摘自
    http://ai.baidu.com/docs/#/ASR-API/top

    描述:百度语音识别通过 REST API 的方式给开发者提供一个通用的 HTTP 接口。 上传需要完整的录音文件,录音文件时长不超过60s。

    :浏览器由于无法跨域请求百度语音服务器的域名,因此无法使用本接口。

    step 1: 获取 Access Token

    建议使用post 传参,请求该地址:

    https://openapi.baidu.com/oauth/2.0/token
    

    所需参数如下:

    grant_type:必须参数,固定为“client_credentials”
    
    client_id:必须参数,应用的 API Key;
    
    client_secret:必须参数,应用的 Secret Key;
    
    mui框架,书写方式
    mui.ajax('https://openapi.baidu.com/oauth/2.0/token', {
        data: {
            grant_type: "client_credentials",
            client_id: "",//此处为申请语音账户时的 API key
            client_secret: ""//此处为申请语音账户似的 Secret Key
        },
        dataType: 'json', //服务器返回json格式数据
        type: 'post', //HTTP请求类型
        timeout: 10000, //超时时间设置为10秒;
        success: function (data) {
            //服务器返回响应,根据响应结果,分析是否登录成功;
            console.log("获取token success----");
            //data.access_token  该值 为可用的 access_token 的值
    
        },
        error: function (xhr, type, errorThrown) {
            //异常处理;
            console.log(type);
            console.log(errorThrown);
        }
    });
    

    注:Access Token 有效期为一个月,开发者需要对 Access Token的有效性进行判断,过期 需要重新获取;

    step 2 请求识别接口,将base64 转换为文字返回

    请求之前

    获取 本地录音(H5+ 书写方式)

    // 扩展API加载完毕,现在可以正常调用扩展API 
    document.addEventListener("plusready", onPlusReady, false);
    var r = null;
    function onPlusReady() {
        r = plus.audio.getRecorder();
        uuId = plus.device.imei;
        console.log(uuId);
    }
    
    function startRecord() {
        if (r == null) {
            console.log("Device not ready!");
            return;
        }
        r.record({
            filename: "_doc/audio/"
        }, function (path) {
            Audio2dataURL(path);//识别到音频文件,调用,转base64 方法
            console.log("Audio record success!");
        }, function (e) {
            console.log("Audio record failed: " + e.message);
        });
    }
    
    function stopRecord() {
        r.stop();
    }
    

    语音转为base64(H5+ 书写方式)

    // 录音语音文件转base64字符串
    function Audio2dataURL(path) {
        var urlArr;
        plus.io.resolveLocalFileSystemURL(path, function (entry) {
            entry.file(function (file) {
                var reader = new plus.io.FileReader();
                //urlSize 为 文件的字节 大小
                var urlSize = file.size;
                reader.onloadend = function (e) {
                    //urlStr 的值,为返回转换的base64数据
                    var urlStr = e.target.result;
                    urlArr = urlStr.split(",")[1];
                    //此处调用,发送给百度语引识别的 函数
                    //例如:
                    sendBaseUrl(urlArr, urlSize, token_val);
                };
                reader.readAsDataURL(file);
            }, function (e) {
                mui.toast("读写出现异常: " + e.message);
            })
        })
    
    }
    

    开始请求

     function sendBaseUrl(speechUrl, urlSize, token_val) {
        mui.ajax('https://vop.baidu.com/server_api', {
            //注意,data内部为json格式,所以,必须是字符串
            data: {
                "format": "amr",//格式支持pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)采样率
                "rate": 8000,//前方有坑,请绕行:此处文档参数16000,达不到这种高保真音频,故 使用8000
                "dev_pid": 1536,//普通话
                "channel": 1,//固定写法(声道)
                "cuid": "862245234377502,862989243244150",//设备的唯一id
                "speech": speechUrl,//base64的音频文件
                "len": urlSize,//文件的大小,字节数
                "token": token_val,//获取到的token值
            },
            headers: {
                'Content-Type': 'application/json'
            },
            dataType: 'json', //服务器返回json格式数据
            type: 'post', //HTTP请求类型
            timeout: 10000, //超时时间设置为10秒;
            success: function (data) {
                //服务器返回响应,根据响应结果,分析是否登录成功;
                console.log("识别ing------");
                console.log(JSON.stringify(data));
    
            },
            error: function (xhr, type, errorThrown) {
                //异常处理;
                console.log(type);
                console.log(errorThrown);
                console.log("识别fail");
            }
        });
    }
    
    tips:若有错误提示,且 已经走到成功回调,建议参照文档,查看错误码。

    说明:本文用途学习交流,并不用于商用。

    相关文章

      网友评论

          本文标题:API 百度 语音识别功能踩坑(菜鸟版)

          本文链接:https://www.haomeiwen.com/subject/ntbyjftx.html