美文网首页
语音识别语言模型和拼音字典文件制作

语音识别语言模型和拼音字典文件制作

作者: kongxx | 来源:发表于2019-01-03 13:23 被阅读8次

    接我前面的文章,下载 pocketsphinx 和 中文模型文件。

    由于模型文件格式有一些要求,所以建议对模型文件的编辑都在Linux上完成。

    准备中文语言文件

    创建一个文本文件 my.txt,内容如下:

    测试
    直走
    左转
    右转
    后退
    开火
    靠喽
    

    生成语音模型文件和字典文件

    访问 http://www.speech.cs.cmu.edu/tools/lmtool-new.html 页面,上传 my.txt 文件,然后使用“COMPILE KNOWLEDGE BASE”来生成模型文件。
    在生成的列表页面,下载最下面的那个 TAR<???>.tgz,文件名是动态产生的,这里我生成的文件名为:TAR2007.tgz。

    下载之。

    解压之。

    编辑其下的 2007.dic 文件,参考 zh_broadcastnews_utf8.dic 文件加入拼音,比如:

    右转 y ou zh uan
    后退 h ou t ui
    左转 z uo zh uan
    开火 k ai h uo
    测试 c e sh ib
    前进 q ian j in
    靠喽 k ao l ou
    

    测试

    使用 pocketsphinx_continuous 工具测试,这里使用了一个我提前录制好的音频文件来做测试,其中参数路径根据自己具体文件位置修改。

    pocketsphinx_continuous -hmm test/zh_broadcastnews_ptm256_8000 -lm test/TAR2007/2007.lm -dict test/TAR2007/2007.dic -infile test/small.wav
    

    相关文章

      网友评论

          本文标题:语音识别语言模型和拼音字典文件制作

          本文链接:https://www.haomeiwen.com/subject/ejefrqtx.html