统计学习方法——修炼学习笔记9：EM算法及其推广

统计学习方法——修炼学习笔记9：EM算法及其推广

作者: Sam_L | 来源:发表于2020-04-03 07:58 被阅读0次

EM 算法
统计学习方法——修炼学习笔记9：EM算法及其推广
统计学习方法9—EM算法
面试题目总结
2016-05-29~06-04：资料
统计机器学习基本概念
李航-第1章统计学习方法概论
EM算法-统计学习方法（李航）
EM算法
李航-第9章EM算法及其推广

EM算法

EM算法是一种迭代算法，用于含有隐变量(hidden variable)的概率模型参数的极大似然估计，或极大后验概率估计。
EM算法的每次迭代由两步组成：

E步，求期望(expectation)；
M步，求极大( maximization )，
所以这一算法称为期望极大算法(expectation maximization algorithm)，简称EM算法。

一、EM算法的引入

EM算法

image.png

Q函数

image.png

使用EM算法的栗子：三硬币模型

image.png

该问题没有解析解，EM迭代法
EM方法：

image.png

EM算法的导出

通过近似求解观测数据的对数似然函数的极大化问题来导出EM算法，由此可以清楚地看出EM算法的作用。面对一个含有隐变量的概率模型，目标是极大化观测数据(不完全数据)Y关于参数theta 的对数似然函数，即

极大化（不完全数据）Y关于参数θ的极大似然函数

image.png

难点：有未观测数据，包含和的对数

EM通过迭代逐步近似极大化L(θ)，希望

image.png

考虑两者的差：

image.png
利用Jensen不等式得到其下界：

image.png

EM算法的直观解释

image.png

图中上方曲线为L(theta)，下方曲线为B(theta, theta(i))，为对数似然函数L(theta)的下界，且在 theta=theta(i)处相等。EM算法找到下一个点theta(i+1)使函数B(theta, theta(i))极大化，也使函数Q(theta, theta(i))极大化。函数B的增加，保证对数似然函数L在每次迭代中也是增加的。EM算法在点theta(i+1)重新计算Q函数值，进行下一次迭代。在这个过程中，对数似然函数L不断增大。从图可以推断出EM算法不能保证找到全局最优值。

3、EM算法在非监督学习中的应用

生成模型由联合概率分布P(X, Y)表示，可以认为非监督学习训练数据是联合概率分布产生的数据。X为观测数据，Y为未观测数据。

二、EM算法的收敛性

EM算法提供一种近似近似含有隐变量概率模型的极大似然估计的方法。最大优点：简单性和普适性。

EM算法收敛性定理

image.png

image.png

EM算法的收敛性包含关于对数似然函数序列L的收敛性和关于参数估计序列theta的收敛性两层意思，前者并不蕴涵后者。此外，定理只能保证参数估计序列收敛到对数似然函数序列的稳定点，不能保证收敛到极大值点。所以在应用中，初值的选择变得非常重要，常用的办法是选取几个不同的初值进行迭代，然后对得到的各个估计值加以比较，从中选择最好的。

三、EM算法在高斯混合模型学习中的应用

1、高斯混合模型

image.png

2、高斯混合模型参数估计的EM算法

假设观测数据由高斯混合模型生成：

image.png

用EM算法估计参数

（1）明确隐变量。写出完全数据的对数似然函数

image.png

完全数据

image.png
似然函数

image.png
完全数据的对数似然函数为

image.png

（2） EM算法的E步:确定Q函数

image.png

（3）确定EM算法的M步

image.png

采用求导的方法

image.png

高斯混合模型参数估计的EM算法

image.png

四、EM算法的推广

EM算法还可以解释为：

F函数(F function)的极大-极大算法(maximization-maximization algorithm)，
广义期望极大(generalized expectation maximization, GEM)算法。

1、F函数的极大-极大算法

F函数

image.png

image.png

image.png

image.png

image.png

2、GEM算法

image.png

image.png

image.png

相关文章

EM 算法
参考: 从最大似然到EM算法浅解（EM算法）The EM Algorithm EM算法及其推广学习笔记 EM算法...
统计学习方法——修炼学习笔记9：EM算法及其推广
EM算法 EM算法是一种迭代算法，用于含有隐变量(hidden variable)的概率模型参数的极大似然估计，或...
统计学习方法9—EM算法
EM算法是一种迭代算法，是一种用于计算包含隐变量概率模型的最大似然估计方法，或极大后验概率。EM即expect...
面试题目总结
算法统计学习方法，每一个算法KNN，朴素贝叶斯，决策树，logistic回归，支持向量机，提升算法，EM算法，隐...
2016-05-29~06-04：资料
主成分分析（Principal components analysis）-最大方差解释 EM算法及其推广我实现了...
统计机器学习基本概念
-------- 李航《统计学习方法》笔记 1. 统计学习三要素模型策略算法 1.1 模型监督学习过程中，...
李航-第1章统计学习方法概论
统计学习方法的三要素：模型、策略和算法。即：统计学习方法 = 模型 + 策略 +算法基本概念监督学习统计学习包...
EM算法-统计学习方法（李航）
这里是做HMM前期学习的EM算法，这里学习了几篇文章，但是始终只懂了原理无法进行实例计算，这里学习了统计学习方法后...
EM算法
EM算法作为数据挖掘领域十大经典算法之一，在统计学习领域也有诸多应用。EM算法（Expectation-maxim...
李航-第9章EM算法及其推广
EM算法的每次迭代由两步组成：E步，求期望；M步，求极大。所以这一算法称为期望极大法（expectation ma...

网友评论

本文标题：统计学习方法——修炼学习笔记9：EM算法及其推广

本文链接：https://www.haomeiwen.com/subject/vjrcphtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|统计学习方法——修炼学习笔记9：EM算法及其推广|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！