美文网首页
语音识别预处理---语音转文字

语音识别预处理---语音转文字

作者: 长毛先生 | 来源:发表于2019-05-14 09:26 被阅读0次

平台:百度语音识别

环境:win7+python3

    利用百度语音识别,由于百度限制了语音文件格式(pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式))和 8k/16k 采样率、16bit 位深、单声道,所以一遍需要先对语音文件做格式转换语音文件分段处理。

一:格式转换

工具:ffmpeg

地址:http://ffmpeg.org/ffmpeg.html

    本人安装静态版本,安装后,将文件先进行格式转换,代码如下:

def change_voiceformat(self,filepath):

#语音文件路径

    file_name = filepath

# 调用系统命令,将文件转换成pcm格式

#  self.pcm_path存放文件路径

    change_voiceformat_command =f".\\ffmpeg\\bin\\ffmpeg -i {file_name} -acodec pcm_s16le -f s16le -ac 1 -ar 16000 {self.pcm_path}"

    os.system(change_voiceformat_command)

二:语音文件分割

工具:speech-vad-demo

地址: https://github.com/Baidu-AIP/speech-vad-demo

集成 webrtc 开源项目,vad模块,具体算法GMM(Gaussian Mixture Model)。

由于百度rest api接口有60s的音频时长限制,使用此demo可以粗略地按照静音切分音频。

先下载后进行安装,在下载的文件夹里可以看到exe执行文件。

def devide_voice(self):

# 先将工作目录切换到.\speech-vad-demo才能执行vad-demo.exe

    os.chdir(".\\speech-vad-demo\\")

# 直接执行.\vad-demo.exe,默认会将.\pcm\16k_1.pcm文件分段 切割并输出到.\output_pcm目录下

    devide_voice_com =f".\\vad-demo.exe"

    os.system(devide_voice_com)

# 切换回工作目录

    os.chdir("..\\")

相关文章

  • 语音识别预处理---语音转文字

    平台:百度语音识别 环境:win7+python3 利用百度语音识别,由于百度限制了语音文件格式(pcm(不压缩)...

  • PHP与语音识别功能现在也是很普遍了

    文章正文 语音识别的功能的应用场景 将语音实时识别为文字,适用于语音聊天、语音输入、语音搜索、语音下单、语音指令、...

  • 关于文字识别的问题,这几款软件可以解决

    文字识别 今天诺子给大家推荐文字识别软件,其中包括图片文字识别,语音转文字,文字转语音,相信很多人都需要这几款软件...

  • NLP

    本地搜索 文本匹配, 与 文本 转化为 声音 匹配。 与 语音识别翻译 ML:搜索识别, 语音识别,文字识别,图像...

  • 智能语音客服服务助手

    智能语音客服服务助手 语音识别 阿里语音识别 百度语音识别 讯飞语音识别 语音合成 阿里语音合成 百度语音合成 讯...

  • 语音笔记本PRD

    product requirements 产品介绍 语音笔记本是一款兼顾长语音输入、文字输入语音朗读、识别图片文字...

  • 语音识别预处理(MFCC)

    梅尔频率倒谱系数(MFCC)资源 MFCC特征参数提取(一)(基于MATLAB和Python实现) kaldi之f...

  • 语音识别(ASR)--语音转文字

    语音识别(Automatic Speech Recognition)是以语音为研究对象,通过语音信号处理和模式识别...

  • H5语音识别/合成 波形图

    语音识别(兼容性较差) 语音合成 即文字转语音 SpeechSynthesisUtterance实例属性和回调 t...

  • 简书一个功能优化----增加语音留言

    功能描述 在留言板支持语音留言,发布留言之后自动语音识别为文字,即语音和文字共存。楼主可以播放语音,也可以查看文本...

网友评论

      本文标题:语音识别预处理---语音转文字

      本文链接:https://www.haomeiwen.com/subject/fgolaqtx.html