医准智能基础知识系列读书讨论班笔记二
线性代数(二)
矩阵的迹(trace)
矩阵的迹指的是一个矩阵(方阵)的主对角线上所有元素的和,用记号 或者
表示:
矩阵的迹,常用于矩阵函数的求导中。
- 一些常用的性质:
- 轮换不变:
,可以推广到一般的
个矩阵相乘
- 常用的关于迹的求导[1]
行列式(determinant)
行列式的值为一个方阵所有特征值的乘积,其几何含义为二维有向面积或三维有向体积向一般高维空间的推广。
- 余子式:
为矩阵
除去第
行和第
列的元素后,剩下的矩阵的行列式的值
- 代数余子式:
- 行列式按行展开:
- 行列式按列展开:
主成分分析(PCA)
问题描述:假定我们手中有 个
维空间中的数据点
,希望在一个维数较低为
的子空间中重建这些点,使得重建后的数据点与原始点的最接近,这个接近指的是丢失最小的关于数据点位置和分布关系的信息。书中将该问题分解为两个子问题:
-
任意给定低维子空间
,如何确定一个点的坐标
-
在知道如何计算每个点在低维空间坐标的基础上,如何寻找一个最优的子空间
对于子问题 1,我们希望在低维子空间中重建的数据点离原数据点尽可能的接近,于是在限制了子空间 为一个 列标准正交的矩阵的前提下,该问题表示为如下的优化问题:
其中, 表示低维子空间
中点的坐标,
是我们希望找到的最理想的坐标。容易看出该问题是一个二次函数求极值问题,问题的目标函数是凸函数,所以函数的稳定点即为问题的最优解:
则由 列标准正交,可得
故
直观来看,最优坐标可通过与子空间的正交基的内积来计算。
对于子问题2,我们需要选取最合适的子空间 使得对于所有的数据点而言,重建误差的 2-范数 平方和最小。可通过如下的优化问题描述:
其中,矩阵,每一列为一个原始数据点
考虑矩阵 的特征分解
,并假设
. 当
时,
退化为列向量
,问题变为
容易求得该问题的最优解为 ,即最大特征值所对应的特征方向,对于
的情况,可以通过数学归纳法得到,所求问题的最优解为前
个最大特征值所对应的特征方向。
网友评论