本文结合内容,摘自
http://ai.baidu.com/docs/#/ASR-API/top
描述:百度语音识别通过 REST API 的方式给开发者提供一个通用的 HTTP 接口。 上传需要完整的录音文件,录音文件时长不超过60s。
注:浏览器由于无法跨域请求百度语音服务器的域名,因此无法使用本接口。
step 1: 获取 Access Token
建议使用post 传参,请求该地址:
https://openapi.baidu.com/oauth/2.0/token
所需参数如下:
grant_type:必须参数,固定为“client_credentials”
client_id:必须参数,应用的 API Key;
client_secret:必须参数,应用的 Secret Key;
mui框架,书写方式
mui.ajax('https://openapi.baidu.com/oauth/2.0/token', {
data: {
grant_type: "client_credentials",
client_id: "",//此处为申请语音账户时的 API key
client_secret: ""//此处为申请语音账户似的 Secret Key
},
dataType: 'json', //服务器返回json格式数据
type: 'post', //HTTP请求类型
timeout: 10000, //超时时间设置为10秒;
success: function (data) {
//服务器返回响应,根据响应结果,分析是否登录成功;
console.log("获取token success----");
//data.access_token 该值 为可用的 access_token 的值
},
error: function (xhr, type, errorThrown) {
//异常处理;
console.log(type);
console.log(errorThrown);
}
});
注:Access Token 有效期为一个月,开发者需要对 Access Token的有效性进行判断,过期 需要重新获取;
step 2 请求识别接口,将base64 转换为文字返回
请求之前
获取 本地录音(H5+ 书写方式)
// 扩展API加载完毕,现在可以正常调用扩展API
document.addEventListener("plusready", onPlusReady, false);
var r = null;
function onPlusReady() {
r = plus.audio.getRecorder();
uuId = plus.device.imei;
console.log(uuId);
}
function startRecord() {
if (r == null) {
console.log("Device not ready!");
return;
}
r.record({
filename: "_doc/audio/"
}, function (path) {
Audio2dataURL(path);//识别到音频文件,调用,转base64 方法
console.log("Audio record success!");
}, function (e) {
console.log("Audio record failed: " + e.message);
});
}
function stopRecord() {
r.stop();
}
语音转为base64(H5+ 书写方式)
// 录音语音文件转base64字符串
function Audio2dataURL(path) {
var urlArr;
plus.io.resolveLocalFileSystemURL(path, function (entry) {
entry.file(function (file) {
var reader = new plus.io.FileReader();
//urlSize 为 文件的字节 大小
var urlSize = file.size;
reader.onloadend = function (e) {
//urlStr 的值,为返回转换的base64数据
var urlStr = e.target.result;
urlArr = urlStr.split(",")[1];
//此处调用,发送给百度语引识别的 函数
//例如:
sendBaseUrl(urlArr, urlSize, token_val);
};
reader.readAsDataURL(file);
}, function (e) {
mui.toast("读写出现异常: " + e.message);
})
})
}
开始请求
function sendBaseUrl(speechUrl, urlSize, token_val) {
mui.ajax('https://vop.baidu.com/server_api', {
//注意,data内部为json格式,所以,必须是字符串
data: {
"format": "amr",//格式支持pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)采样率
"rate": 8000,//前方有坑,请绕行:此处文档参数16000,达不到这种高保真音频,故 使用8000
"dev_pid": 1536,//普通话
"channel": 1,//固定写法(声道)
"cuid": "862245234377502,862989243244150",//设备的唯一id
"speech": speechUrl,//base64的音频文件
"len": urlSize,//文件的大小,字节数
"token": token_val,//获取到的token值
},
headers: {
'Content-Type': 'application/json'
},
dataType: 'json', //服务器返回json格式数据
type: 'post', //HTTP请求类型
timeout: 10000, //超时时间设置为10秒;
success: function (data) {
//服务器返回响应,根据响应结果,分析是否登录成功;
console.log("识别ing------");
console.log(JSON.stringify(data));
},
error: function (xhr, type, errorThrown) {
//异常处理;
console.log(type);
console.log(errorThrown);
console.log("识别fail");
}
});
}
tips:若有错误提示,且 已经走到成功回调,建议参照文档,查看错误码。
说明:本文用途学习交流,并不用于商用。
网友评论