基本的定义
正定和半正定这两个词的英文分别是positive definite和positive semi-definite,其中,definite是一个形容词,表示“明确的、确定的”等意思。
【定义1】给定一个大小为的实对称矩阵
,若对于任意长度为 的非零向量,有 恒成立,则矩阵 是一个正定矩阵。
【例1】单位矩阵 是否是正定矩阵?
解:设向量 为非零向量,则
由于,故恒成立,即单位矩阵 是正定矩阵。
【简单证明】对于任意单位矩阵 而言,给定任意非零向量 ,恒有
【例2】 实对称矩阵 = 是否是正定矩阵?
解:设向量 为非零向量,则
因此,矩阵 是正定矩阵。
【定义2】给定一个大小为的实对称矩阵 ,若对于任意长度为 的向量,有 恒成立,则矩阵 是一个半正定矩阵。
从二次函数到正定/半正定矩阵
在初中数学中,我们学习过二次函数,该函数的曲线会经过坐标原点,当参数 时,曲线的“开口”向上,参数 时,曲线的“开口”向下。
以 为例,曲线如下:
实际上,我们可以将 视作
的多维表达式。
当我们希望 对于任意向量 都恒成立,就要求矩阵是一个半正定矩阵,对应于二次函数,
需要使得 .
另外,在 中,我们还知道:若 ,则对于任意 ,有 恒成立。
这在 也有契合之处,当矩阵是正定矩阵时,对于任意 恒成立。
我们可以记 ,那么对于正定矩阵有,看到这有没有想起cos公式呢?如下:
下面的内容是一层一层推进的,所以可能有点绕,请耐心阅读并思考:
-
所以正定矩阵是个什么意思呢?实际上就是说对于一个向量X,我们希望 X在经过有一个矩阵A的变化后得到的新的向量M和它本身的夹角小于90度。
-
而小于90度背后的含义是变换后的向量M是沿着原向量X的正方向进行缩放的(即 M投影回原向量时方向不变)。
也就是说:
若给定任意一个正定矩阵 和一个非零向量,则两者相乘得到的向量 与向量 的夹角恒小于 . (等价于:.)
为什么协方差矩阵要是半正定的?
在概率论与数理统计中,协方差矩阵被定义为:
对于任意多元随机变量 ,协方差矩阵为
现给定任意一个向量 ,则
其中,
由于 ,因此, ,协方差矩阵 是半正定的。
网友评论