美文网首页
百度DeepSpeech-Training Your Own M

百度DeepSpeech-Training Your Own M

作者: 王兴岭 | 来源:发表于2020-03-25 10:06 被阅读0次

训练模型的准备

开始

安装 python虚拟环境

pip install virtualenv

安装sox

  • Ubuntu 安装命令
sudo apt install sox
sudo apt install lame
sudo apt install libsox-fmt-all
  • Mac安装
brew install sox

Install Git Large File Storage

clone DeepSpeech

 git clone https://github.com/mozilla/DeepSpeech

创建虚拟环境:

virtualenv -p python3 $HOME/tmp/deepspeech-train-venv/

激活虚拟环境:

source $HOME/tmp/deepspeech-train-venv/bin/activate
  • DeepSpeech 下载完成后

安装Python依赖

cd DeepSpeech
pip3 install -r requirements.txt

安装ds_ctcdecoder

pip3 install $(python3 util/taskcluster.py --decoder)

普通话训练集准备 zh-CN.tar.gz

下载地址
要将这些数据转换为DeepSpeech可以理解的格式,您必须运行CommonVoice v2.0导入程序(bin/import_cv2.py)

bin/import_cv2.py /path/commonvoice # 普通话训练集目录,根据自己的具体位置调整

一旦导入完成, clips 子文件夹会有必须的 .mp3 和添加的 .wav 文件.还会添加 .csv文件:

clips/train.csv
clips/dev.csv
clips/test.csv

解析tain.csv,生成alpha,然后将其复制粘贴到DeepSpeech/data/alphabet.txt, 其他dev.csv,test.csv一样处理

python3 util/check_characters.py -csv path/commonvoice/clips/train.csv -unicode -alpha > def.txt

训练模型

./DeepSpeech.py --train_files ../data/CV/en/clips/train.csv #--dev_files ../data/CV/en/clips/dev.csv --test_files ../data/CV/en/clips/test.csv

参考

相关文章

网友评论

      本文标题:百度DeepSpeech-Training Your Own M

      本文链接:https://www.haomeiwen.com/subject/nnttuhtx.html