最近在做一个项目,需要把出租车轨迹点映射到路段上,需要用到HMM,所以先好好学习下这个东西吧。

正文
隐马尔科夫模型(hidden Markov model ,HMM)是可用于标注问题的统计学习模型,描述由隐藏的马尔科夫链随机生成观测序列的过程,属于生成模型。隐马尔科夫模型在语音识别、自然语言处理、生物信息、模式识别等领域有着广泛的应用。
隐马尔科夫模型的定义
隐马尔科夫模型是关于时序的概率模型,描述由一个隐藏的马尔科夫链随机生成不可观测的状态随机序列,再由各个状态生成一个观测而产生观测随机序列的过程,隐藏的马尔科夫链随机生成的状态序列,称为状态序列;每个状态生成一个观测,而由此产生的观测的随机序列,称为观测序列。每个序列的每一个位置又可以看作是一个时刻。
关于状态和观测两个词的个人理解:拿地理的有关知识来说说吧,土壤的贫瘠和肥沃状态,我们可以通过它表面的植被情况观测到。土壤的状态所影响的植被情况,这是我们可以观测到的。
马尔科夫链:在任意时刻t的状态只依赖于前一时刻的状态,与其它时刻的状态及观测无关,也与时刻t无关,用公式表示如下:

上述it是在时刻t下的状态
设Q是所有状态的集合,V是所有可能的观测的集合。

其中N是可能的状态数,M是可能的观测数。
I是长度为T的状态序列,O是对应的观测序列。

如图2 所示

A是状态转移概率矩阵:

其中,

是在时刻t处于状态qi的条件下在时刻t+1转移到状态qj的概率。
B是观测概率矩阵:


是在时刻t处于状态qj的条件下生成观测Vk的概率
π是初始状态概率向量:

其中,

是时刻t=1处于状态qi的概率。
隐马尔科夫模型由初始状态概率向量π,状态转移概率矩阵A和观测概率矩阵B决定。π和A决定状态序列,B决定观测序列。因此,隐马尔科夫模型λ可以用三元符号表示,即

A,B,π称为隐马尔科夫模型的三要素。
状态转移概率矩阵A与初始状态概率向量π确定了隐藏的马尔科夫链,生成不可观测的状态序列。观测概率矩阵B确定了如何从状态生成观测,与状态序列综合确定了如何产生观测序列。
后文:
简书的数学公式编辑不得不吐槽
网友评论