美文网首页
[kaldi] Kaldi与Pytorch

[kaldi] Kaldi与Pytorch

作者: 原来是酱紫呀 | 来源:发表于2019-08-03 09:14 被阅读0次

## 1. Kaldi

###(1)Kaldi

Kaldi是一个用C ++编写的语音识别工具包,项目其宗旨就是为了给语音识别研究人员使用,因为kaldi拥有大多数标准技术的代码和脚本,包括所有标准线性变换,MMI,增强MMI和MCE判别训练,以及特征空间判别训练(如fMPE,但基于提升的MMI),使得国内大部分语音识别领域的专家学者其语音研究结果都是基于kaldi来进行的。

###(2)kaldi中nnet nnet1 nnet3的区别?

## 2. Pytorch+Kaldi

1.    查看语音信息

soxi 1a_1.wav

2.    Kaldi 先后设计了不同的神经网络构架(nnet1、 nnet2、nnet3),其中 nnet3 越来越被研究者所接受,相较于其他两种构架, nnet3 采用计算图(Computational Graph)的思路,可以更容易地设计各种类型的网络结构,并支持多任务并行计算,大大缩短训练时间。

3.      Kaldi中各子目录中的steps和utils软链接的是各个案例公用的标准目录,放于egs/wsj。

steps包括的文件与系统训练和使用步骤直接相关,utils包括一些可能会用到的实用工具。

4.      执行 . ./path.sh ,使得当前shell下可以直接调用Kaldi编译出来的C++可执行程序和相关脚本,方便进一步分析和使用,如将中断的语句单独取出,并于命令行运行,可加快调试。当不加任何参数直接运行这些程序或脚本时,可打印使用方法。

相关文章

网友评论

      本文标题:[kaldi] Kaldi与Pytorch

      本文链接:https://www.haomeiwen.com/subject/kuwddctx.html