美文网首页
MIT 线性代数 15 子空间投影

MIT 线性代数 15 子空间投影

作者: 光能蜗牛 | 来源:发表于2022-05-22 18:31 被阅读0次

    二维空间的投影推导

    image.png
    问题描述:对于二维平面而言,想要计算从向量b到向量a的投影p,其中可以看出
    e=b-p,
    p=xa,(x是我们需要求的一个倍数关系)
    我们注意到向量e和向量a,是一个垂直正交关系
    于是有
    a^Te=0

    a^T(b-xa)=0

    xa^Ta=a^Tb

    于是x=\frac{a^Tb}{a^Ta}

    那么投影向量p=xa=\frac{a^Tb}{a^Ta}a=\frac{aa^T}{a^Ta}b
    这个地方为什么能直接把b拿到外面
    可以做一个简单的推导
    假设a=\begin{bmatrix}a1\\a2\end{bmatrix},b=\begin{bmatrix}b1\\b2\end{bmatrix}

    p=xa=\frac{a^Tb}{a^Ta}a=\frac{a^Tba}{a^Ta}=\frac{1}{a^Ta}\begin{bmatrix}a1(a1b1+a2b2)\\a2(a1b1+a2b2)\end{bmatrix}

    =\frac{1}{a^Ta}\begin{bmatrix}a1a1b1+a1a2b2\\a1a2b1+a2a2b2)\end{bmatrix}

    =\frac{1}{a^Ta}\begin{bmatrix}a1a1b1+a1a2b2\\a1a2b1+a2a2b2)\end{bmatrix}\begin{bmatrix}b1\\b2\end{bmatrix}

    =\frac{1}{a^Ta}\begin{bmatrix}a1\\a2\end{bmatrix}\begin{bmatrix}a1&a2\end{bmatrix}\begin{bmatrix}b1\\b2\end{bmatrix}

    =\frac{aa^T}{a^Ta}b

    这应该是一个特殊的性质,具体笔者不多赘述,
    继续上面的话题
    也就是说
    p=\frac{aa^T}{a^Ta}b 我们定义大P=\frac{aa^T}{a^Ta},认为矩阵P是向量b投影到向量a的一个投影矩阵,其投影结果为向量p

    我们注意到
    P的列空间C(P)是一条过向量a的直线
    P的秩rank(P)=1,因为从上面的推导我们发现aa^T是一个常见的秩1矩阵
    P=P^T
    以及
    P=P^2

    N维空间的投影矩阵推导

    微信图片_20220411195444.png
    Ax=b的无解的问题可以用上图表示
    ,首先我们知道如果b在矩阵A的列空间,那么就一定会有Ax=b成立,即有解,
    b不在A的列空间时候,因为b无法由矩阵A的列空间进行线性组合得到,于是无解

    这里面我们稍微结合上图看一下,矩阵的A的两个列空间为a1,a2
    我们无法通过a1,a2进行组合得到向量b,因为b不在矩阵A的列空间内,但是我们可以通过组合得到向量bA的列空间的投影p
    A\hat{x}=p是一定有解的,因为p就是在矩阵A的列空间内
    我们把A\hat{x}=p求出的\hat{x}认为是Ax=b的最优解

    有了上面的前提,我们注意到向量p和向量b的关系可以用一个差值e表示,于是e=b-p
    这里的关键点在于e和a1,a2.均正交,于是我们有

    a1^Te=0
    a2^Te=0

    写成矩阵形式

    \begin{bmatrix} a1^T\\a2^T \end{bmatrix}e=0

    因为e=b-p=b-A\hat{x}
    于是

    \begin{bmatrix} a1^T\\a2^T \end{bmatrix}(b-A\hat{x})=0

    A^T(b-A\hat{x})=0
    再继续下去之前,回忆一下,我们知道e=b-A\hat{x}是矩阵A^T的零空间,即矩阵A的左零空间,可见矩阵A的左零空间和矩阵A的列空间是互为正交补的关系
    这意味着e\perp columnspace(A)

    我们继续将上面的等式稍作整理,于是有
    A^TA\hat{x}=A^Tb----------------1
    \hat{x}=(A^TA)^{-1}A^Tb--------------2
    b在矩阵A的列空间的投影
    p=A\hat{x}=A(A^TA)^{-1}A^Tb-----------3

    可知投影矩阵P=A(A^TA)^{-1}A^T,它能实现向量b到矩阵A的列空间组合向量p的投影

    观察投影矩阵以及结合实际的一些想法,我们发现P有如下性质
    P=P^T

    证明:P^T=(A(A^TA)^{-1}A^T)^T=A(A^TA)^{-T}A^T=A(A^TA)^{-1}A^T=P
    这说明P是一个对称阵,投影矩阵是对称阵,说明应该有些特殊的性质,这里笔者暂不了解

    P=P^2

    证明:P^2=A(A^TA)^{-1}A^TA(A^TA)^{-1}A^T=A(A^TA)^{-1}A^T=P
    这说明Pb的多次投影可以等价于一次投影

    相关文章

      网友评论

          本文标题:MIT 线性代数 15 子空间投影

          本文链接:https://www.haomeiwen.com/subject/xluisrtx.html