数学之美--隐含马尔科夫模型

作者: 加勒比海鲜王 | 来源:发表于2017-06-13 10:17 被阅读143次

数学之美在google中文黑板报的原文
数学之美--隐含马尔科夫模型
《数学之美》之隐含马尔科夫模型
HMM模型和Viterbi算法
python 日常笔记 hmmlearn 隐性马尔科夫模型案例分
第5章隐含马尔可夫模型
大学生学数学，不妨读《数学之美》这本书
机器学习系列-随机过程
隐性马尔科夫模型简介,只聊原理, (保证没有数学)
Jieba分词原理浅析与应用（上）

保留初心，砥砺前行

这是令人兴奋的一个章节。

因为科研中总是充满了马尔科夫。

隐含马尔科夫模型也是机器学习的主要工具之一。

引用这句话的目的也是为了证明这一章节的重要性。

引例：

在通信模型中，信息源发出信号s₁,s₂,s₃,...，接收器收到o₁,0₂,0₃,...。解码操作就是通过收到的o₁,0₂,0₃,...还原回s₁,s₂,s₃,...。
如何根据o₁,0₂,0₃,...得到s₁,s₂,s₃,...，可以把这项工作理解成由o₁,0₂,0₃,...，最有可能产生哪一种s₁,s₂,s₃,...。解释成概率论的语言就是在o₁,0₂,0₃,...已知的情况下，求P(s₁,s₂,s₃,...|o₁,0₂,0₃,...)达到最大时的那一串s₁,s₂,s₃,...。也就是如下公式：

![](http://www.forkosh.com/mathtex.cgi? S_{1},S_{2},S_{3},S_{4},\ldots =ArgMaxP\left( S_{1},S_{2},S_{3},\ldots |O_{1},O_{2},O_{3},\ldots \right))
利用贝叶斯公式，可以把上式等价变成

![](http://www.forkosh.com/mathtex.cgi? \dfrac {P\left(O_{1},O_{2},O_{3} ,O_{4} ,\ldots |S_{1},S_{2},S_{3},\ldots \right)\cdot P\left( S_{1},S_{2},S_{3}\right)} {P\left( O_{1},O_{2},O_{3}\right)})

其中，分子的左边的P代表在信息s₁,s₂,s₃,...经过传输后变成o₁,0₂,0₃,...的可能性；右边的P代表是一个正常信号的概率；分母代表接发送端产生信息o₁,0₂,0₃,...的可能性。

o₁,0₂,0₃,...一旦产生，就不会再发生变化，因此P(o₁,0₂,0₃,...)可以看作一个常数，上面公式就可以等价成

![](http://www.forkosh.com/mathtex.cgi?{P\left(O_{1},O_{2},O_{3} ,\ldots |S_{1},S_{2},S_{3},\ldots \right)\cdot P\left( S_{1},S_{2},S_{3}\right)} )

这个公式可以用隐含马尔科夫模型来估计。

隐含马尔科夫模型

马尔科夫假设在随机过程中每个状态s_t的概率分布，只与它的前一个状态s_t-1有关，即![](http://www.forkosh.com/mathtex.cgi?{P\left(S_{t} |S_{1},S_{2},S_{3},S_{4}, \ldots ,S_{t-1}\right)={P\left(S_{t} |S_{t-1}\right) )
符合这个假设的随机过程成为马尔科夫过程，也称为马尔科夫链。

这一段是重点内容：
可以把这个马尔科夫链想象成一台机器，它随机的选择一个状态作为初始状态开始运行，并且按照马尔科夫链的规则持续选择后续状态。这样在运行了一段时间T后，就会产生一个状态序列：s₁,s₂,s₃,... ,s_T。根据这个序列，很容易得到某个状态s_i出现的次数#(s_i)，也很容易得到s_i转换到s_j的次数#(s_i,s_j)。从而得到s_i转移到s_j的概率：#(s_i,s_j) / #(s_i)。