美文网首页
线代-奇异值

线代-奇异值

作者: 倪桦 | 来源:发表于2023-01-19 02:10 被阅读0次

    特征值,特征向量,相似性,对角化,对称矩阵,正交对角化等系列概念均基于方阵提出。

    而现实中通常要处理的矩阵都属于长方阵形式。
    对于一个m \times n的非方阵A来说,可以通过A^TA方式构造一个对称n\times n的方阵;

    对于A^TA来说

    • 其第ij列的元素a_{ij}\ \ \A^T的第i行点乘A的第j列的结果\leftrightarrow 也即Ai\cdot j
    • 其第ji列的元素a_{ji}\ \ \A^T的第j行点乘A的第i列的结果\leftrightarrow 也即Aj\cdot i
    • \therefore a_{ij} =a_{ji}$

    因此,若A是一个m \times n的矩阵,则A^TA将得到一个对称的n \times n方阵,
    从而A^TA可以被正交对角化,拥有n个实数特征值,n个互相垂直的标准特征向量(模等于1)
    \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \lambda_1,\lambda_2,\lambda_3,... \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \vec v_1,\vec v_2,\vec v_3,...

    取出方阵A^TA的某一特征值\lambda _i与其对应的一个标准特征向量\vec v_i,存在如下联系:
    \|A \cdot \vec v_i\|^{2} = (A \vec v_i)\cdot (A \vec v_i) = (A \vec v_i)^{T} (A \vec v_i) = \vec v_i^{T} A^T A \vec v_i
    \because \vec v_i是方阵A^TA的一个标准特征向量
    \therefore \vec v_i^{T} A^T A \vec v_i = \vec v_i^{T} \lambda _i \vec v_i = \lambda _i \vec v_i^T\vec v_i = \lambda _i \|\vec v_i\|^{2} = \lambda _i

    \therefore \|A \cdot \vec v_i\|^{2} = \lambda _i,同时表明方阵A^TA的特征值\lambda _i \ge 0

    推出奇异值(Singular Value) \therefore \sigma _i = \sqrt { \|A \cdot \vec v_i\|^{2} } = \sqrt {\lambda _i},奇异值表示了A\vec v_i的长度。

    根据矩阵的行空间与列空间一章,对于一个m \times n的矩阵A,其列空间将由矩阵内线性无关的列向量组生成(dim (Colspace) \le m)。在这里,向量组\{A\vec v_i\}构成矩阵A列空间的一组正交基(\lambda _i \ne 0)

    正交性证明
    取出\{A\vec v_i\}中的两个基向量 A\vec v_i , A\vec v_j
    (A\vec v_i)(A\vec v_j) = (A\vec v_i)^T(A\vec v_j) =\vec v_i^TA^TA\vec v_j = \vec v_i^T(\lambda _j\vec v_j) = \lambda _j \vec v_i^T\vec v_j = \lambda _j(\vec v_i\vec v_j)=0

    证明\{A\vec v_i\}A的一组正交基
    方阵A^TAn个标准特征向量组\{\vec v_1,\vec v_2,...,\vec v_n\}构成n维空间的一组基, 则该空间内任意向量\vec x = k_1\vec v_1 + k_2\vec v_2 + ... + k_n\vec v_n
    对于A 的列空间(维度\le m)中的向量\vec y(含有m个元素),可以在一个n维空间中寻找一个\vec x,从而表示为\vec y = A \cdot \vec x的结果(m\times n \cdot n\times 1 = m)。
    \therefore \vec y = A \cdot \vec x = A\cdot k_1\vec v_1 + A\cdot k_2\vec v_2 + ... + A\cdot k_n\vec v_n = k_1A\vec v_1 + k_2A\vec v_2 + ... + k_nA\vec v_n

    k_1A\vec v_1 + k_2A\vec v_2 + ... + k_nA\vec v_n就是\{A\vec v_i\}向量组的线性组合,由于\lambda _i = 0 \rightarrow \sqrt { \|A \cdot \vec v_i\|^{2} } \rightarrow A\vec v_i =O,从而使\{A\vec v_i\}向量组内存在线性相关组,所以刨去了\lambda _i = 0这个因素之后,得到的\{A\vec v_i\}向量组内的所有向量将构成正交关系[①中已证明],形成矩阵A的列空间的一组正交基
    在处理奇异值的时候,通常按从大到小的顺序排列\sigma _i,从而去掉等于0 的奇异值。

    如果Ar个不为零的奇异值,则\{A\vec v_1,A\vec v_2,...,A\vec v_r\}A的列空间的一组正交基
    A的列空间的维度为rrank(A) = r
    A的列空间的一组标准正交基将描述为 \{ \frac {A\vec v_1}{\sigma _1}\, \frac {A\vec v_2}{\sigma _2}\,..., \frac {A\vec v_r}{\sigma _r}\} ;
    进一步简化表述\vec u_i = \frac {A\vec v_i}{\sigma _i}\ \ \ \{\vec u_1,\vec u_2,...,\vec u_r \}在这里可以看到\sigma = 0 等式将无意义。
    使用向量组\{\vec u_1,\vec u_2,...,\vec u_r \}能更方便的表示一个矩阵。

    相关文章

      网友评论

          本文标题:线代-奇异值

          本文链接:https://www.haomeiwen.com/subject/gpffhdtx.html