GMM-HMM语音识别模型2

作者: 诸葛村姑 | 来源:发表于2017-11-16 10:50 被阅读0次

GMM-HMM语音识别模型2
无标题文章
Kaldi 安装与简介
GMM-HMM声学模型
GMM-HMM语音识别模型3
语音识别端到端模型解读：FSMN及其变体模型
深度学习之算法岗面试题（一）
kaldi 源码分析(八) - DNN训练过程
重磅！MaxCompute助力阿里开源自研语音识别模型DFSMN
深度学习第10次作业机器学习循环序列模型

有人总结了语音识别就分为三步：第一步，把帧识别成状态（难点）。第二步，把状态组合成音素。第三步，把音素组合成单词。第一步可以当做gmm做的，后面都是hmm做的。如果你能把单词识别出来，那句子也就很简单了。当然，识别句子就会有语言模型的作用。

以下放上这段时间浏览博客的网址：

1.kaldi语音识别的资料

http://blog.csdn.net/sheshou199/article/details/53260369

给出了几个学习语音识别的网址。

2.GMM-HMM语音识别模型原理篇

http://blog.csdn.net/abcjennifer/article/details/27346787?utm_source=tuicool

这篇博客讲解了GMM-HMM模型，识别和训练的方法、原理以及基本推导公式，看完这篇博客，会有很多地方都不懂，再去看一篇英文论文A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition，入门必读。

3.GMM-HMM语音识别简单理解

http://blog.csdn.net/mingtsang/article/details/11024705

这篇博客的特点主要是给出了语音识别与训练的细节，包括步骤中的输入输出等。

这时，GMM-HMM框架原理基本了解一些，输入输出也了解一些，但还是感觉如同雾里看花，总感觉最重要的东西没有抓住，更别提做实验了，准备下一步看speech recognition process，以及kaldi手册，周末准备自己推一下所有流程，以做到心中有数，不虚。

思考：GMM高斯混合模型是对谁建立的？对每一个隐状态吗？每个隐状态又是对应什么？多个观察序列？就是多个39维MFCC特征？？？

网友评论

本文标题：GMM-HMM语音识别模型2

本文链接：https://www.haomeiwen.com/subject/dtqlvxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

GMM-HMM语音识别模型2

相关文章