其实也无所谓技巧,所谓的技巧也是因为不熟悉而已。
摸清重要几个目录:
1、/home/data/export/a05/xna/data/data_aishell
存放wav、transcript两个目的
wav 目录,有train,dev,test三个目录,我们要修改的是test目录,将自己的语料改成与test目录一致的格式
transcript目录下txt文件存放语料与内容的映射关系,如果只做声纹,不做ASR就不需要改动。如果做ASR则需要将映射内容也放进去。
可以通过脚本将test的内容合并到transcript目录下的txt文件中去
2、然后就是傻瓜式执行run.sh,注意,run.sh会先包含两个文件,可以设定参数,比如内从大小,建议尽量调整大一些,否则跑起来会比较慢
3、如果test有更新,很容易重新跑失败,因为有些临时文件存在的原因。解决办法就是删除。实在没办法,新建一个s5或v1目录,把必要文件(夹)拷贝过去即可。哪些是必要文件?新的kaldi.zip解压后就知道了。
网友评论