英语学习:
annotate:注释
externally imposed:外部加强的
overall:整体的
prototypical:原型的
acoustic:原声的,听觉的
decoder:解码器
spectrum:光谱,波谱,范围
comprise:包含,由...构成
phonetic alphabet:拼音
ultimately:最终,基本上
extraordinary:非凡的,独特的
sparsity:稀疏
elaboration:阑述,精心完成
phonemes:音素,是构成音节的最小语音片段
alphabet:字母表
character:字母
phones:说某种语言的,发声的工具,可以理解为不同的口音
1、隐马尔可夫模型
![](https://img.haomeiwen.com/i1512748/338b53abc28eb6c7.png)
![](https://img.haomeiwen.com/i1512748/f23f595ecc12d19b.png)
它可以说是动态贝叶斯网络的一个子集,不同之处在于它的节点并不表示随机变量,并且可能存在环状结构。
这是三个隐马尔可夫结构的分类:
2TBN---unrolled DBN---rolled
隐马尔可夫可以模型可以说是动态贝叶斯中最重要的模型了。
2、应用范围
![](https://img.haomeiwen.com/i1512748/283b54653bc00222.png)
在机器人轨迹,语音识别,生物序列识别,文本识别中都有重要应用。
3、机器人定位
![](https://img.haomeiwen.com/i1512748/3d7abc57dab2dd29.png)
机器人定位的三个要素分别是:控制信号,隐藏节点(方向和距离),观测节点(地图上的位置)
4、语音识别
![](https://img.haomeiwen.com/i1512748/218433beba968321.png)
![](https://img.haomeiwen.com/i1512748/e4c55b2f9138579a.png)
![](https://img.haomeiwen.com/i1512748/5f953656165fb52f.png)
![](https://img.haomeiwen.com/i1512748/05be00333df66650.png)
![](https://img.haomeiwen.com/i1512748/41a0d7598d391607.png)
![](https://img.haomeiwen.com/i1512748/55ebef8755b20a9c.png)
其中重要的环节是语音的分割,中间层是单词的分割,因为一般单词之间的语音信号存在间隙,其实最小的分割单位是音素,也就是语音的最小单位。
注意语音识别是按照开始到结束在回到开始的顺序识别的,与文本识别不同在于一个是字母为最小单位,一个是音素为最小单位。
网友评论