![](https://img.haomeiwen.com/i4264437/d14ab0529d5f7d09.png)
在EM算法和混合高斯模型(一)中我们推了解了EM算法并对其进行了简单的推导。EM算法用处很多,在隐马尔可夫(HMM)和混合高斯模型(GMM)中都有重要的应用。本文将简要介绍EM算法在混合高斯模型中的应用。
高斯混合模型
顾名思义,高斯混合模型是指某一群体中含有多个高斯分布,具有如下形式的概率分布模型:
![](https://img.haomeiwen.com/i4264437/983f0147dd765833.png)
αk可看作是不同第k个高斯分布的权重,代表一个数据属于第k个高斯分布的概率。
高斯混合模型参数估计的EM算法
假设观测数据y1,y2, ... ...,yn由高斯混合模型生成,则y的分布符合下面高斯混合模型的概率密度分布:
![](https://img.haomeiwen.com/i4264437/0a5daf5c14519d04.png)
我们可以设想这些数据的生成过程:数据yj首先依据各个分布的权重αk选择第k个高斯分布, 然后依据第k个高斯分布的概率分布φ(y|θk)生成数据yj。数据yj是已知的,反映观测数据yj来自哪个分布k是未知的,k=1, 2, ... ... , K, 以隐变量γjk表示,其定义如下:
![](https://img.haomeiwen.com/i4264437/0b0a9109de80dfa7.png)
有了观测数据yj及未观测数据γjk,那么完全数据是:
![](https://img.haomeiwen.com/i4264437/0816dcdfd424fde6.png)
![](https://img.haomeiwen.com/i4264437/509aac200ccced71.png)
![](https://img.haomeiwen.com/i4264437/74bf90d828ca8d9a.png)
E步,确定Q函数
![](https://img.haomeiwen.com/i4264437/bc2644bb88850ff0.png)
M步:
![](https://img.haomeiwen.com/i4264437/ca3494bf34a65a77.png)
![](https://img.haomeiwen.com/i4264437/a4fdc8f36c4c4591.png)
高斯混合模型参数估计的EM算法如下:
参考:
《统计学习方法》李航
网友评论