训练模型的准备
- Python 3.6
- Git Large File Storage
- Mac or Linux environment
- virtualenv
开始
安装 python虚拟环境
pip install virtualenv
安装sox
- Ubuntu 安装命令
sudo apt install sox
sudo apt install lame
sudo apt install libsox-fmt-all
- Mac安装
brew install sox
Install Git Large File Storage
clone DeepSpeech
git clone https://github.com/mozilla/DeepSpeech
创建虚拟环境:
virtualenv -p python3 $HOME/tmp/deepspeech-train-venv/
激活虚拟环境:
source $HOME/tmp/deepspeech-train-venv/bin/activate
- DeepSpeech 下载完成后
安装Python依赖
cd DeepSpeech
pip3 install -r requirements.txt
安装ds_ctcdecoder
pip3 install $(python3 util/taskcluster.py --decoder)
普通话训练集准备 zh-CN.tar.gz
下载地址
要将这些数据转换为DeepSpeech可以理解的格式,您必须运行CommonVoice v2.0导入程序(bin/import_cv2.py
)
bin/import_cv2.py /path/commonvoice # 普通话训练集目录,根据自己的具体位置调整
一旦导入完成, clips 子文件夹会有必须的 .mp3
和添加的 .wav
文件.还会添加 .csv
文件:
clips/train.csv
clips/dev.csv
clips/test.csv
解析tain.csv,生成alpha
,然后将其复制粘贴到DeepSpeech/data/alphabet.txt
, 其他dev.csv
,test.csv
一样处理
python3 util/check_characters.py -csv path/commonvoice/clips/train.csv -unicode -alpha > def.txt
训练模型
./DeepSpeech.py --train_files ../data/CV/en/clips/train.csv #--dev_files ../data/CV/en/clips/dev.csv --test_files ../data/CV/en/clips/test.csv
参考
网友评论