数学基础-高斯模型

作者: 三余寻真 | 来源:发表于2015-01-26 22:19 被阅读1286次

在之前的一篇文章[机器学习-Bayesian概念学习,简书]中提到了一组常用的共轭分布,beta分布-二项分布,它们都是离散型的概率分布,而一组更一般的离散型共轭分布为Dirichlet分布-多项分布。共轭分布一般用在我们需要给参数加先验条件时,为了使运算式子保持统一的形式从而简化计算,通常我们会采取共轭分布,更一般地,可以考虑共轭分布的线性组合,同时兼顾了先验分布的合理性。

而在常见的连续概率分布-高斯分布中,也经常会有类似的讨论。下面分享一些我学习高斯模型的体会。一维的高斯分布可能都不陌生,这里直接从更一般的多维高斯模型出发。

多维高斯分布

其中在指数中出现的Σ为对称正定矩阵,故它的所有特征值都是正的,所有特征向量都互相正交,可以用来做度量,前后乘以(x-μ)就可以看做是||x-μ||_Σ的平方,即Σ范数的平方,由此可看出它是一维高斯分布的推广,而当Σ为单位矩阵时,Σ范数便回到了我们熟悉的二范数。

假如Σ有特征值λ和特征向量u,则Σ的逆可以有如下分解

From: Murphy

同时||x-μ||_Σ可以写为

From: Murphy

其中yi=<ui,x-μ>,即为x-μ在第i个特征向量方向上的投影。由上式可以看出,λi越大,则在第i个方向上的影响越小,同时λi越小,则相对来说在第i个方向上的影响越大。放到下图来看,若由μ出发的向量y越靠近方向u1方向,则范数越小,越靠近u2方向,则范数越大。图中所示的红色椭圆是一个“等高线”,椭圆上的每一点在Σ范数下与μ的距离都相同,椭圆的轴长关系对应于λ的大小,即λ越大,相应方向的轴长越大。

From: Murphy

当Σ为单位矩阵I时,或者更一般地,Σ的特征值都相等,则椭圆的各方向轴长都相等,从而多维高斯分布的等高线为圆,而这也对应于一维的情况。

Reference:

Machine Learning-A Probabilistic Perspective, Kevin P. Murphy, 2012.

相关文章

  • 数学基础-高斯模型

    在之前的一篇文章[机器学习-Bayesian概念学习,简书]中提到了一组常用的共轭分布,beta分布-二项分布,它...

  • EM算法和混合高斯模型(二)

    高斯混合模型 顾名思义,高斯混合模型是指某一群体中含有多个高斯分布,具有如下形式的概率分布模型: 高斯混合模型参数...

  • 数学

    概率统计 (1)极大似然思想(2)贝叶斯模型(3)隐变量混合概率模型,EM思想基础的典型分布:正态(高斯)分布。 ...

  • 隐马尔可夫模型|机器学习推导系列(十七)

    一、概述 1. 介绍 动态模型可以类比高斯混合模型这种静态模型,高斯混合模型的特点是“混合”,动态模型的特点是在“...

  • 高斯数学

    不得不说,小朋友们现在的数学难度比我们那个时候要高很多。 作为爸爸,对Rango的数学辅导工作自然就落在了我的肩上...

  • 高斯混合模型

    高斯混合模型(Gaussian Mixture Model)高斯混合模型,通常简称GMM,是一种广泛使用的聚类算法...

  • 机器学习-概率图模型初探

    outline 数学基础 HMM CRF 主题模型 数学基础 贝叶斯公式: 联概 = 条概*边概条件概率 = 联合...

  • 天才 5 高斯

    数学家 高斯1 高斯(Johann Carl Friedrich Gauss, 1777 - 1855)是全...

  • EM算法在高斯混合模型的应用

    定义 EM算法的一个重要应用是高斯混合模型的参数估计,高斯混合模型的应用广泛,在许多情况下,EM算法是学习高斯混合...

  • GMM - MOG的前世今生

    为什么混合高斯模型有效? 想象一下,只有一束光射向桌面,桌面上的光点是符合高斯分布的,所以要运用高斯模型。但是如果...

网友评论

    本文标题:数学基础-高斯模型

    本文链接:https://www.haomeiwen.com/subject/fsvkxttx.html