思必驰语音唤醒，录音机噪音数据的处理

作者: meteos | 来源:发表于2018-03-20 17:34 被阅读68次

思必驰语音唤醒，录音机噪音数据的处理
01. malloc: Heap corruption dete
语音交互中的思必驰与声智开发
语音交互流程
重构实时离线一体化数仓，Apache Doris 在思必驰的应用
智能语音起风，富士康、联发科“站队”这家AI公司
基于Ameba的度秘(DuerOS)上手初体验
随笔0416/速记——车载AI语音初步理解
思必驰多视角构筑AI生态屏障，AI芯片打通最后一公里
机器学习基础与实践（一）数据清洗

思必驰语音唤醒LocalWakeup示例，使用思必驰内部录音机模式，我需要将音频数据导出存储，方便用户回放。  
示例中的代码如下:
private class AISpeechListenerImpl implements AIWakeupListener {
    @Override
    public void onBufferReceived(byte[] buffer) {
        //将buffer数据写入音频文件
        storeToAudioFile(buffer);
    }
}

写入的音频文件需要加wav头部信息才能使用普通的播放过器播放，参考

在获取wav音频文件后会发现几个问题：

有呲呲呲的噪音
人的说话声偏慢
定时录的1分钟的音频文件转化出来是1分钟12-15秒

onBufferReceived回调方法基本上是每80ms执行一次，所以每分钟执行750次，每次buffer数据的长度为3200，所以每分钟数据为

750*3200=2400000byte

标准的16KHz,16bit,单声道音频文件的大小应该是

16000*16*1*60/8=1920000byte

思必驰的数据比标准音频数据多，所以转化的时候会多出来12~15秒数据
由于采样率、采样大小、声道都是确定的，所以出问题的地方应该就是buffer数据的长度了，可能buffer数组的后面一部分为空数据，1920000/750=2560byte,标准音频每80ms只需要2560byte的数据，那么buffer数组后面可能有3200-2560=640个空数据

验证：在onBufferReceived方法中将buffer的内容打印出来，大部分数据都是在索引为2560的地方开始，后面的数据全部为0

结论：在storeToAudioFile(buffer)方法中只取了前面2560byte的真实数据,后面的空数据不写入文件就行了。
补充：以上内容是在红米手机2上的测试结果，在小米6上每分钟执行600次，3200个byte的buff都是有效数据，所以需要自己封装方法检查buffer数据，删除后面的全0数据。

网友评论

本文标题：思必驰语音唤醒，录音机噪音数据的处理

本文链接：https://www.haomeiwen.com/subject/tppbqftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

思必驰语音唤醒，录音机噪音数据的处理

相关文章

思必驰语音唤醒，录音机噪音数据的处理

01. malloc: Heap corruption dete

语音交互中的思必驰与声智开发

语音交互流程

重构实时离线一体化数仓，Apache Doris 在思必驰的应用

智能语音起风，富士康、联发科“站队”这家AI公司

基于Ameba的度秘(DuerOS)上手初体验

随笔0416/速记——车载AI语音初步理解

思必驰多视角构筑AI生态屏障，AI芯片打通最后一公里

机器学习基础与实践（一）数据清洗

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读