美文网首页@IT·互联网微信小程序开发程序员
微信小程序语音搜索踩坑之路——SUSE版

微信小程序语音搜索踩坑之路——SUSE版

作者: AI看舌 | 来源:发表于2016-12-06 16:29 被阅读4107次

    直接调用微信小程序录音接口,然后上传到服务器,百度语音的接口是识别不了这种格式的文件,那么问题来了

    一、如何转码?ffmpeg?

    二、如何在PHP中使用?

    本文将要解决这两个问题。

    用到的第三方工具:

    1、百度语音

    2、silk文件格式转换

    一、转码silk文件格式

    传送门在此:https://github.com/kn007/silk-v3-decoder

    需要注意的是:

    1、首先要安装- ffmpeg,具体安装方法请自行百度,如果要转码成MP3格式,请记得启用libmp3lame 即 --enable-libmp3lame

    2、如果在使用silk-v3-decoder 过程中提示转码失败,请自行添加ffmpeg到环境变量或者修改converter.sh,如下所示,建议后者,因为通过PHP执行shell脚本是不读环境变量的

    二、如何在PHP中使用

    有了上面的神器之后,妈妈再也不用担心语音识别问题了。

    目前采用thinkPHP 5作为服务端系统,在小程序端把音频文件上传到后台,TP5已有文件上传功能的封装,具体上传代码不细说;

    我们只需要读取上传的文件,通过shell命令进行转码,然后把转码后的文件发送给百度语音接口即可得到语音识别结果。

    需要注意如下几点:

    1、其中php执行转码的代码如下

    $real_file即为转码后的音频文件的绝对地址,建议转换成WAV格式,amr格式转换不成功,原因未知。

    2、调用百度语音接口格式设置

    需要设置音频格式为WAV,码率为16000或者8000,如图所示:

    三、总结

    1、新版的小程序返回的silk文件内容是webm+base64,对于这种情况,请先将base64字符解码,然后通过下面指令专门成WAV格式,其他格式请自行解码:

    base64解码函数:

    function decode_base64_file( $inputfile, $outputfile ) {

    /* read data (binary) */

    $ifp = fopen( $inputfile, "rb" );

    $rawData = fread( $ifp, filesize( $inputfile ) );

    fclose( $ifp );

    $data = explode(',', $rawData);

    /* encode & write data (binary) */

    $ifp = fopen( $outputfile, "wb" );

    fwrite( $ifp, base64_decode($data[1]) );

    fclose( $ifp );

    /* return output filename */

    return( $outputfile );

    }

    FFmpeg解码命令:

    ffmpeg -i 【解码后文件路径】 -ab 12.2k -ar 8000 -ac 1 【输出文件路径】

    2、小程序语音接口和公众号的语音接口不一样,公众号语音接口返回的是amr格式,小程序的是silk格式,是Skype开源的一个网络音频格式,通过传送门中的工具即可转码,转码工具先是转成pcm格式文件,然后转成指定格式,其实pcm这种格式百度语音已经可以识别,有需要的童鞋可以修改converter.sh脚本。

    相关文章

      网友评论

        本文标题:微信小程序语音搜索踩坑之路——SUSE版

        本文链接:https://www.haomeiwen.com/subject/caermttx.html