直接调用微信小程序录音接口,然后上传到服务器,百度语音的接口是识别不了这种格式的文件,那么问题来了
一、如何转码?ffmpeg?
二、如何在PHP中使用?
本文将要解决这两个问题。
用到的第三方工具:
1、百度语音
2、silk文件格式转换
一、转码silk文件格式
传送门在此:https://github.com/kn007/silk-v3-decoder
需要注意的是:
1、首先要安装- ffmpeg,具体安装方法请自行百度,如果要转码成MP3格式,请记得启用libmp3lame 即 --enable-libmp3lame
2、如果在使用silk-v3-decoder 过程中提示转码失败,请自行添加ffmpeg到环境变量或者修改converter.sh,如下所示,建议后者,因为通过PHP执行shell脚本是不读环境变量的
二、如何在PHP中使用
有了上面的神器之后,妈妈再也不用担心语音识别问题了。
目前采用thinkPHP 5作为服务端系统,在小程序端把音频文件上传到后台,TP5已有文件上传功能的封装,具体上传代码不细说;
我们只需要读取上传的文件,通过shell命令进行转码,然后把转码后的文件发送给百度语音接口即可得到语音识别结果。
需要注意如下几点:
1、其中php执行转码的代码如下
$real_file即为转码后的音频文件的绝对地址,建议转换成WAV格式,amr格式转换不成功,原因未知。
2、调用百度语音接口格式设置
需要设置音频格式为WAV,码率为16000或者8000,如图所示:
三、总结
1、新版的小程序返回的silk文件内容是webm+base64,对于这种情况,请先将base64字符解码,然后通过下面指令专门成WAV格式,其他格式请自行解码:
base64解码函数:
function decode_base64_file( $inputfile, $outputfile ) {
/* read data (binary) */
$ifp = fopen( $inputfile, "rb" );
$rawData = fread( $ifp, filesize( $inputfile ) );
fclose( $ifp );
$data = explode(',', $rawData);
/* encode & write data (binary) */
$ifp = fopen( $outputfile, "wb" );
fwrite( $ifp, base64_decode($data[1]) );
fclose( $ifp );
/* return output filename */
return( $outputfile );
}
FFmpeg解码命令:
ffmpeg -i 【解码后文件路径】 -ab 12.2k -ar 8000 -ac 1 【输出文件路径】
2、小程序语音接口和公众号的语音接口不一样,公众号语音接口返回的是amr格式,小程序的是silk格式,是Skype开源的一个网络音频格式,通过传送门中的工具即可转码,转码工具先是转成pcm格式文件,然后转成指定格式,其实pcm这种格式百度语音已经可以识别,有需要的童鞋可以修改converter.sh脚本。
网友评论