在本科阶段的教材中,往往会有多元正态分布的公式出现,但课堂上都不会重点讲解,而在研究生入学考试中也基本不会考。但在实际应用中,多元的情况却非常常见。
本文通过对多元正态分布的公式进行拆解,来正式认识一下它。
1 多元正态分布公式
对于维正态分布变量
,直接上它的密度公式:
其中为
的均值向量,
为
的协方差矩阵。
公式看起来十分复杂,相信第一次见到时,几乎所有人都会被吓到。沉住气,我们把它拆解了看。
2 公式拆解
先看最后面指数函数中的部分,其中有一个二次型:
叫作
和
之间的Mahalanobis distance,中文叫马哈拉诺比斯距离或者马氏距离,是印度统计学家Mahalanobis提出的。
一般可以是对称矩阵,考虑它的
个特征值
和相应的相互正交的特征向量
,
,记
,
满足
,再记
,那么可将
写成特征向量展开的形式:
如果做换元,则有
,也就是说,通过换元,我们将原来在
坐标系下的分布,变成了一个在
坐标系下的、各个分量互相不相关的分布。如图所示:

再看在指数函数前面的部分,由可知
,因此
。
利用Jacobian matrix ,并由
可得
,于是我们可以将原来的密度函数直接变换为
在原来的坐标系下,各分量之间可能有相关性,对应二维时候的图像为下图(1),而在新的
坐标系下,协方差矩阵变为对角矩阵,也因此图像变为下图中(2)的情况,而若各分量同方差,则会变为类似于标准正态分布的同心圆即下图(3)的形式:

网友评论