最近看了几个知乎live,感觉不错,需要反复听。因此想把这些live保存下来转成文本方便后面学习。
知乎live中的音频实际文件格式为mp4,我使用的是百度语音识别API,百度语音识别API只支持PCM,WAV以及AMR。因此想到用ffmpeg来做转换。
转换命令如下:
ffmpeg -i god.mp4 -vn -acodec pcm_s16le -ar 16000 -ac 1 god.wav
上面两个地方需要注意:
-ar 16000:音频采样率设置为16k
-ac 1:单声道
百度语音识别API只支持单声道的音频文件。
网友评论