美文网首页
思必驰语音唤醒,录音机噪音数据的处理

思必驰语音唤醒,录音机噪音数据的处理

作者: meteos | 来源:发表于2018-03-20 17:34 被阅读68次
    思必驰语音唤醒LocalWakeup示例,使用思必驰内部录音机模式,我需要将音频数据导出存储,方便用户回放。  
    示例中的代码如下:
    private class AISpeechListenerImpl implements AIWakeupListener {
        @Override
        public void onBufferReceived(byte[] buffer) {
            //将buffer数据写入音频文件
            storeToAudioFile(buffer);
        }
    }
    

    写入的音频文件需要加wav头部信息才能使用普通的播放过器播放,参考

    1. Wav数据格式的44个字节头部信息汇总
    2. android how can i write byte to wav file

    在获取wav音频文件后会发现几个问题:

    1. 有呲呲呲的噪音
    2. 人的说话声偏慢
    3. 定时录的1分钟的音频文件转化出来是1分钟12-15秒

    onBufferReceived回调方法基本上是每80ms执行一次,所以每分钟执行750次,每次buffer数据的长度为3200,所以每分钟数据为

    750*3200=2400000byte
    

    标准的16KHz,16bit,单声道音频文件的大小应该是

    16000*16*1*60/8=1920000byte
    

    思必驰的数据比标准音频数据多,所以转化的时候会多出来12~15秒数据
    由于采样率采样大小声道都是确定的,所以出问题的地方应该就是buffer数据的长度了,可能buffer数组的后面一部分为空数据1920000/750=2560byte,标准音频每80ms只需要2560byte的数据,那么buffer数组后面可能有3200-2560=640个空数据

    验证:在onBufferReceived方法中将buffer的内容打印出来,大部分数据都是在索引为2560的地方开始,后面的数据全部为0
    

    结论:在storeToAudioFile(buffer)方法中只取了前面2560byte的真实数据,后面的空数据不写入文件就行了。
    补充:以上内容是在红米手机2上的测试结果,在小米6上每分钟执行600次,3200个byte的buff都是有效数据,所以需要自己封装方法检查buffer数据,删除后面的全0数据。

    相关文章

      网友评论

          本文标题:思必驰语音唤醒,录音机噪音数据的处理

          本文链接:https://www.haomeiwen.com/subject/tppbqftx.html