多元正态分布初识

作者: Boye0212 | 来源:发表于2021-04-13 13:22 被阅读0次

多元正态分布初识
多元正态分布的极大似然估计
2018-04-03-概率大坑
06 EM算法 - 案例一 - EM分类初识及GMM算法实现
机器学习实践项目之高斯分布
初识R语言—统计篇之正态分布和抽样分布
异常检测统计学方法
学习笔记|程序员的数学：概率统计#5
正态分布的条件分布与边缘分布
正态分布

在本科阶段的教材中，往往会有多元正态分布的公式出现，但课堂上都不会重点讲解，而在研究生入学考试中也基本不会考。但在实际应用中，多元的情况却非常常见。

本文通过对多元正态分布的公式进行拆解，来正式认识一下它。

1 多元正态分布公式

对于 $D$ 维正态分布变量 $x$ ，直接上它的密度公式：
$\mathcal{N}(x|\mu,\Sigma)=\dfrac{1}{(2\pi)^{D/2}}\dfrac{1}{\vert\Sigma\vert^{1/2}}\exp\left\{-\dfrac{1}{2}(x-\mu)'\Sigma^{-1}(x-\mu)\right\}$

其中 $\mu$ 为 $D\times 1$ 的均值向量， $\Sigma$ 为 $D\times D$ 的协方差矩阵。

公式看起来十分复杂，相信第一次见到时，几乎所有人都会被吓到。沉住气，我们把它拆解了看。

2 公式拆解

先看最后面指数函数中的部分，其中有一个二次型：
$\Delta^2=(x-\mu)'\Sigma^{-1}(x-\mu)$

$\Delta$ 叫作 $\mu$ 和 $x$ 之间的Mahalanobis distance，中文叫马哈拉诺比斯距离或者马氏距离，是印度统计学家Mahalanobis提出的。

$\Sigma$ 一般可以是对称矩阵，考虑它的 $D$ 个特征值 $\lambda_i$ 和相应的相互正交的特征向量 $u_i$ ， $\Sigma u_i = \lambda_i u_i$ ，记 $U=(u_1,\cdots,u_D)$ ， $U$ 满足 $U'U=I_D$ ，再记 $\Lambda=\text{diag}(\lambda_1,\cdots,\lambda_D)$ ，那么可将 $\Sigma$ 写成特征向量展开的形式：
$\Sigma =U\Lambda U'= \sum_{i=1}^{D} \lambda_i u_i u_i'$

如果做换元 $y=U'(x-\mu)$ ，则有 $\Delta^2=y'\Lambda^{-1}y$ ，也就是说，通过换元，我们将原来在 $x$ 坐标系下的分布，变成了一个在 $y$ 坐标系下的、各个分量互相不相关的分布。如图所示：

image.png

再看在指数函数前面的部分，由 $\Sigma =U\Lambda U'$ 可知 $|\Sigma|=|\Lambda|$ ，因此 $|\Sigma|^{-1}=|\Lambda|^{-1}=\prod\limits_{j=1}^{D}\lambda_j^{-1}$ 。

利用Jacobian matrix $J=U'$ ，并由 $|J|^2=|U'U|=1$ 可得 $|J|=1$ ，于是我们可以将原来的密度函数直接变换为
$\begin{aligned} f_Y(y) =& |J|f_X\left(x(y)\right)\\ =& \dfrac{1}{(2\pi)^{D/2}}\dfrac{1}{\vert\Lambda\vert^{1/2}}\exp\left\{-\dfrac{1}{2}y'\Lambda^{-1}y\right\}\\ =& \prod_{j=1}^{D} \dfrac{1}{(2\pi \lambda_j)^{1/2}}\exp(-\dfrac{y_j^2}{2\lambda_j}) \end{aligned}$

在原来的 $x$ 坐标系下，各分量之间可能有相关性，对应二维时候的图像为下图（1），而在新的 $y$ 坐标系下，协方差矩阵变为对角矩阵，也因此图像变为下图中（2）的情况，而若各分量同方差，则会变为类似于标准正态分布的同心圆即下图（3）的形式：

多元正态分布初识
在本科阶段的教材中，往往会有多元正态分布的公式出现，但课堂上都不会重点讲解，而在研究生入学考试中也基本不会考。但在...
多元正态分布的极大似然估计
马氏距离 1. 一元正态分布的密度函数 2. 多元正态分布的密度函数 3. 多元正态分布的极大似然估计 4. 对数...
2018-04-03-概率大坑
No.1 多元高斯分布（1）多元高斯分布（多元正态分布）简介 | 数据学习者官方网站(Datalearner) ...
06 EM算法 - 案例一 - EM分类初识及GMM算法实现
05 EM算法 - 高斯混合模型 - GMM 多元正态分布 - multivariate_normal API参考...
机器学习实践项目之高斯分布
多元高斯分布与一元高斯分布的关系首先一维标准正态分布：二维标准正态分布，就是两个独立的一维标准正态分布随机变量...
初识R语言—统计篇之正态分布和抽样分布
初识正态分布检验正态分布的三种方法 qq图 2.夏皮罗检验（shapiro.test）当w接近1，p > 0.0...
异常检测统计学方法
大纲 1. 概述[#1] 2. 参数方法[#2] 2.1 基于正态分布的一元异常点检测[#2.1] 2.2 多元...
学习笔记|程序员的数学：概率统计#5
5. 协方差矩阵、多元正态分布与椭圆 5.1 协方差与相关系数 5.1.1 协方差定义：性质：依据协方差的正...
正态分布的条件分布与边缘分布
本文总结多元正态分布的条件分布与边缘分布，证明不难，但都比较繁琐，故不做详细证明，有兴趣可以参考Pattern R...
正态分布
正态分布的概率密度：如果μ=0且σ=1，则为标准正态分布：每个正态分布都可以表示为标准正态分布：正态分布函数...