## 1. Kaldi
###(1)Kaldi
Kaldi是一个用C ++编写的语音识别工具包,项目其宗旨就是为了给语音识别研究人员使用,因为kaldi拥有大多数标准技术的代码和脚本,包括所有标准线性变换,MMI,增强MMI和MCE判别训练,以及特征空间判别训练(如fMPE,但基于提升的MMI),使得国内大部分语音识别领域的专家学者其语音研究结果都是基于kaldi来进行的。
###(2)kaldi中nnet nnet1 nnet3的区别?
## 2. Pytorch+Kaldi
1. 查看语音信息
soxi 1a_1.wav
2. Kaldi 先后设计了不同的神经网络构架(nnet1、 nnet2、nnet3),其中 nnet3 越来越被研究者所接受,相较于其他两种构架, nnet3 采用计算图(Computational Graph)的思路,可以更容易地设计各种类型的网络结构,并支持多任务并行计算,大大缩短训练时间。
3. Kaldi中各子目录中的steps和utils软链接的是各个案例公用的标准目录,放于egs/wsj。
steps包括的文件与系统训练和使用步骤直接相关,utils包括一些可能会用到的实用工具。
4. 执行 . ./path.sh ,使得当前shell下可以直接调用Kaldi编译出来的C++可执行程序和相关脚本,方便进一步分析和使用,如将中断的语句单独取出,并于命令行运行,可加快调试。当不加任何参数直接运行这些程序或脚本时,可打印使用方法。
网友评论