问题
1. 什么是EM
2. EM算法流程是怎么样的
3. EM算法的优缺点
1. EM算法介绍
EM算法是一种从不完全数据或有数据丢失 的数据集中求解概率模型参数的最大似然估计方法。算法未知参数是 样本属于哪一个分布(理解为 样本没有y值,也就是隐藏变量) 和 模型参数 。
2. EM算法流程
1. 初始化模型参数 (相当于Kmeans算法中,初始化簇中心)
2. E步:根据初始化的模型参数,计算隐藏变量的后验概率 (相当于Kmeans算法中, 样本属于哪一个簇)
3. M步:根据E步计算的后验概率,更新模型参数 (相当于Kmeans算法中,更新簇中心)
4. 循环 2,3 步骤,直到收敛
3. EM算法优缺点
优点
算法简单,稳定上升的步骤能非常可靠地找到“最优的收敛值”
缺点
对初始值敏感,模型参数会影响收敛效果
参考资料
【1】从最大似然到EM算法浅解
【2】马尔科夫链详解
【3】EM算法原理总结
【4】EM算法
网友评论