美文网首页
台大数位语音处理第四课part1

台大数位语音处理第四课part1

作者: 马尔克ov | 来源:发表于2019-07-22 16:51 被阅读0次

本节课主要内容HMM三个基本问题如何求解

首先明确两种observe有两种,离散/连续。语音识别中使用连续状态(MFCC特征值是连续的)。连续的比较复杂,需要用函数(GMM)拟合。离散的简单,用矩阵描述即可。


离散/连续状态

review三个基本问题


三个基本问题

1. Evaluation

粗暴解法:遍历每一种可能的hidden state/observe组合,求加和求概率。


粗暴解法

优化解法Forward:类似数学归纳法。找到n和n+1之间的关系,再计算第一项。避免重复计算。


image.png

2.decoding

backward:和forward相反


image.png

区别1:在时间t,beta看到的是t+1及以后的,必须从i隐状态出发,后面无所谓。alpha是已知0到t,求t+1
区别2:qt在alpha里是待计算概率,在beta里是条件

近似

近似:假设B和A无关,也就是0-t和t+1以后无关

3. Train

EM算法,回头来补充

相关文章

网友评论

      本文标题:台大数位语音处理第四课part1

      本文链接:https://www.haomeiwen.com/subject/aefmlctx.html