美文网首页高等代数
高等代数理论基础48:特征值与特征向量

高等代数理论基础48:特征值与特征向量

作者: 溺于恐 | 来源:发表于2019-03-28 07:47 被阅读16次

    特征值与特征向量

    特征值与特征向量

    定义:设\mathscr{A}​是数域P上线性空间V的一个线性变换,若对于\lambda_0\in P​,存在一个非零向量\xi​,使\mathscr{A}\xi=\lambda_0\xi​

    则称\lambda_0\mathscr{A}的一个特征值,\xi称为\mathscr{A}的属于特征值\lambda_0的一个特征向量

    注:

    1.特征向量的方向经过线性变换后保持在同一直线上

    2.特征向量不是被特征值唯一确定的,若\xi是线性变换\mathscr{A}的属于特征值\lambda_0的特征向量,则\xi的任一非零倍数k\xi也是\mathscr{A}的属于\lambda_0的特征向量

    \mathscr{A}\xi=\lambda_0\xi\Rightarrow \mathscr{A}(k\xi)=\lambda_0(k\xi)

    3.特征值被特征向量唯一确定,一个特征向量只能属于一个特征值

    求法:

    设V是数域P上n维线性空间,\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n​是一组基,线性变换\mathscr{A}​在这组基下的矩阵是A,设\lambda_0​是特征值,它的一个特征向量\xi​\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n​下的坐标为x_{01},x_{02},\cdots,x_{0n}​,则\mathscr{A}\xi​的坐标为A\begin{pmatrix}x_{01}\\x_{02}\\\vdots\\x_{0n}\end{pmatrix}​,\lambda_0\xi​的坐标为\lambda_0\begin{pmatrix}x_{01}\\x_{02}\\\vdots\\x_{0n}\end{pmatrix}​

    \mathscr{A}\xi=\lambda_0\xi相当于坐标之间的等式A\begin{pmatrix}x_{01}\\x_{02}\\\vdots\\x_{0n}\end{pmatrix}=\lambda_0\begin{pmatrix}x_{01}\\x_{02}\\\vdots\\x_{0n}\end{pmatrix}

    (\lambda_0E-A)\begin{pmatrix}x_{01}\\x_{02}\\\vdots\\x_{0n}\end{pmatrix}=0

    即特征向量\xi的坐标(x_{01},x_{02},\cdots,x_{0n})满足齐次方程组

    \begin{cases}a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=\lambda_0x_1\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=\lambda_0x_2\\ \cdots\\ a_{n1}x_1+a_{n2}x_2+\cdots+a_{nn}x_n=\lambda_0x_n\end{cases}

    \begin{cases}(\lambda_0-a_{11})x_1-a_{12}x_2-\cdots-a_{1n}x_n=0\\ -a_{21}x_1+(\lambda_0-a_{22})x_2-\cdots-a_{2n}x_n=0\\ \cdots\\ -a_{n1}x_1-a_{n2}x_2-\cdots+(\lambda_0-a_{nn})x_n=0\end{cases}

    \xi\neq 0​,故它的坐标x_{01},x_{02},\cdots,x_{0n}​不全为零,即齐次方程组有非零解

    |\lambda_0E-A|=\begin{vmatrix}\lambda_0-a_{11}&-a_{12}&\cdots&-a_{1n}\\ -a_{21}&\lambda_0-a_{22}&\cdots&-a_{2n}\\ \vdots&\vdots& &\vdots\\ -a_{n1}&-a_{n2}&\cdots&\lambda_0-a_{nn}\end{vmatrix}=0​

    特征多项式

    定义:设A是数域P上一n级矩阵,\lambda是一个文字,矩阵\lambda E-A的行列式

    |\lambda E-A|=\begin{vmatrix}\lambda-a_{11}&-a_{12}&\cdots&-a_{1n}\\ -a_{21}&\lambda-a_{22}&\cdots&-a_{2n}\\ \vdots&\vdots& &\vdots\\ -a_{n1}&-a_{n2}&\cdots&\lambda-a_{nn}\end{vmatrix}

    称为A的特征多项式,是数域P上的一个n次多项式

    注:若\lambda_0是线性变换\mathscr{A}的特征值,则\lambda_0是矩阵A的特征多项式的一个根,反之,若\lambda_0是矩阵A的特征多项式在数域P中的一个根,即|\lambda_0E-A|=0,则对应齐次方程组有非零解,若(x_{01},x_{02},\cdots,x_{0n})是方程组的一个非零解,则非零向量\xi=x_{01}\varepsilon_1+x_{02}\varepsilon_2+\cdots+x_{0n}\varepsilon_n满足\mathscr{A}\xi=\lambda_0\xi

    \lambda_0是线性变换\mathscr{A}的一个特征值,\xi是数域特征值\lambda_0的一个特征向量

    确定线性变换\mathscr{A}的特征值与特征向量:

    1.在线性空间V中取一组基\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n​,写出\mathscr{A}​在这组基下的矩阵A

    2.求出A的特征多项式|\lambda E-A|在数域P中全部的根,即\mathscr{A}的全部特征值

    3.将所求得的特征值逐个代入方程组,对每个特征值,解方程组,求出一组基础解系,即属于这个特征值的几个线性无关的特征向量在基\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n下的坐标,求出属于每个特征值的全部线性无关的特征向量

    例:

    1.n维线性空间中,数乘变换\mathscr{K}在任一组基下的矩阵都是kE,它的特征多项式为|\lambda E-kE|=(\lambda-k)^n

    故数乘变换\mathscr{K}的特征值只有k

    由定义,每个非零向量都是属于数乘变换\mathscr{K}的特征向量

    2.设线性变换\mathscr{A}在基\varepsilon_1,\varepsilon_2,\varepsilon_3下的矩阵是A=\begin{pmatrix}1&2&2\\2&1&2\\2&2&1\end{pmatrix}

    \mathscr{A}的特征值与特征向量

    特征多项式为|\lambda E-A|=\begin{vmatrix}\lambda-1&-2&-2\\-2&\lambda-1&-2\\-2&-2&\lambda-1\end{vmatrix}=(\lambda+1)^2(\lambda-5)

    故特征值为-1(二重)和5

    把特征值-1代入齐次方程组\begin{cases}(\lambda-1)x_1-2x_2-2x_3=0\\ -2x_1+(\lambda-1)x_2-2x_3=0\\ -2x_1-2x_2+(\lambda-1)x_3=0\end{cases}

    可得\begin{cases}-2x_1-2x_2-2x_3=0\\ -2x_1-2x_2-2x_3=0\\ -2x_1-2x_2-2x_3=0\end{cases}

    基础解系为\begin{pmatrix}1\\0\\-1\end{pmatrix},\begin{pmatrix}0\\1\\-1\end{pmatrix}

    故属于-1的两个线性无关的特征向量为\xi_1=\varepsilon_1-\varepsilon_3,\xi_2=\varepsilon_2-\varepsilon_3

    属于-1的全部特征向量为k_1\xi_1+k_2\xi_2,k_1,k_2取遍数域P中不全为零的全部数对

    再将特征值5代入得\begin{cases}4x_1-2x_2-2x_3=0\\ -2x_1+4x_2-2x_3=0\\ -2x_1-2x_2+4x_3=0\end{cases}

    基础解系为\begin{pmatrix}1\\1\\1\end{pmatrix}

    故属于5的一个线性无关的特征向量为\xi_3=\varepsilon_1+\varepsilon_2+\varepsilon_3

    属于5的全部特征向量为k\xi_3,k是P中任意不为零的数

    3.在空间P[x]_n中,线性变换\mathscr{D}f(x)=f’(x)在基1,x,{x^2\over 2!},\cdots,{x^{n-1}\over (n-1)!}下的矩阵为

    D=\begin{pmatrix}0&1&0&\cdots&0\\ 0&0&1&\cdots&0\\ \vdots&\vdots&\vdots& &\vdots\\ 0&0&0&\cdots&0\end{pmatrix}

    D的特征多项式为

    |\lambda E-D|=\begin{vmatrix}\lambda&-1&0&\cdots&0\\ 0&\lambda&-1&\cdots&0\\ \vdots&\vdots&\vdots& &\vdots\\ 0&0&0&\cdots&-1\\ 0&0&0&\cdots&0\end{vmatrix}=\lambda^n

    故D的特征值为0

    通过解相应齐次线性方程组可知,属于特征值0的线性无关的特征向量组只能是任一非零常数

    即微商为零的多项式只能是零或非零常数

    4.平面上全体向量构成实数域上一个二维线性空间

    选择\mathscr{G}_\theta在直角坐标系下的矩阵为\begin{pmatrix}cos\theta&-sin\theta\\sin\theta&cos\theta\end{pmatrix}

    特征多项式为\begin{vmatrix}\lambda-cos\theta&sin\theta\\sin\theta&cos\theta\end{vmatrix}=\lambda^2-2\lambda \cos\theta+1

    \theta\neq k\pi时,多项式无实根,故\theta\neq k\pi时,\mathscr{G}_\theta没有特征值

    特征子空间

    对线性变换\mathscr{A}的任一特征值\lambda_0,适合条件\mathscr{A}\alpha=\lambda_0\alpha的向量\alpha所成的集合,即\mathscr{A}的属于\lambda_0的全部特征向量再添上零向量所成的集合,是V的一个子空间,称为\mathscr{A}的一个特征子空间,记作V_{\lambda_0}

    注:V_{\lambda_0}的维数是属于\lambda_0的线性无关的特征向量的最大个数,V_{\lambda_0}=\{\alpha|\mathscr{A}\alpha=\lambda_0\alpha,\alpha\in V\}

    \lambda E-A|=\begin{vmatrix}\lambda-a_{11}&-a_{12}&\cdots&-a_{1n}\\ -a_{21}&\lambda-a_{22}&\cdots&-a_{2n}\\ \vdots&\vdots& &\vdots\\ -a_{n1}&-a_{n2}&\cdots&\lambda-a_{nn}\end{vmatrix}

    展开式中,有一项是主对角线上元素的连乘积(\lambda-a_{11})(\lambda-a_{22})\cdots(\lambda-a_{nn})

    其余各项至多包含n-2个主对角线上的元素,对\lambda的次数最多是n-2

    故特征多项式中含\lambda的n次与n-1次项只能在主对角线上元素的连乘积中出现

    \lambda^n-(a_{11}+a_{22}+\cdots+a_{nn})\lambda^{n-1}

    \lambda=0,可得常数项|-A|=(-1)^n|A|

    故若只写出特征多项式的前两项与常数项,有|\lambda E-A|=\lambda^n-(a_{11}+a_{22}+\cdots+a_{nn})\lambda^{n-1}+\cdots+(-1)^n|A|

    |\lambda E-A|在数域P上能分解为一次因式的乘积,由根与系数的关系,A的全体特征值的和为a_{11}+a_{22}+\cdots+a_{nn},称为A的迹,记作Tr(A),A的全体特征值的积为|A|

    注:特征值被线性变换确定,在有限维空间中,任取一组基,特征值为线性变换在这组基下矩阵的特征多项式的根,基不同则线性变换的矩阵一般也不同,但是相似

    定理:相似的矩阵有相同的特征多项式

    证明:

    设A\sim B,即有可逆矩阵X,使B=X^{-1}AX

    \therefore |\lambda E-B|=|\lambda E-X^{-1}AX|

    =|X^{-1}(\lambda E-A)X|=|X^{-1}||\lambda E-A||X|

    =|\lambda E=A|\qquad\mathcal{Q.E.D}

    注:

    1.定理说明线性变换的矩阵的特征多项式与基的选择无关,直接被线性变换决定,故可称为线性变换的特征多项式

    2.定理的逆不成立,特征多项式相同的矩阵不一定相似

    A=\begin{pmatrix}1&0\\0&1\end{pmatrix},B=\begin{pmatrix}1&1\\0&1\end{pmatrix}

    它们的特征多项式都是(\lambda-1)^2,但A和B不相似,和A相似的矩阵只能是A

    Hamilton-Cayley定理

    定理:设A是数域P上一个n\times n矩阵,f(\lambda)=|\lambda E-A|是A的特征多项式,则

    f(A)=A^n-(a_{11}+a_{22}+\cdots+a_{nn})A^{n-1}+\cdots+(-1)^n|A|E=O

    证明:

    设B(\lambda)是\lambda E-A的伴随矩阵

    由行列式性质

    B(\lambda)(\lambda E-A)=|\lambda E-A|E=f(\lambda)E

    \because 矩阵B(\lambda)的元素是|\lambda E-A|的各个代数余子式

    都是\lambda的多项式,次数不超过n-1

    \therefore 由矩阵运算性质

    B(\lambda)=\lambda^{n-1}B_0+\lambda^{n-2}B_1+\cdots+B_{n-1}

    其中B_0,B_1,\cdots,B_{n-1}都是n\times n数字矩阵

    设f(\lambda)=\lambda^n+a_1\lambda^{n-1}+\cdots+a_{n-1}\lambda+a_n

    则f(\lambda)E=\lambda^nE+a_1\lambda^{n-1}E+\cdots+a_nE

    B(\lambda)(\lambda E-A)=(\lambda^{n-1}B_0+\lambda^{n-2}B_1+\cdots+B_{n-1})(\lambda E-A)

    =\lambda^n B_0+\lambda^{n-1}(B_1-B_0A)+\lambda^{n-2}(B_2-B_1A)+\cdots+\lambda(B_{n-1}-B_{n-2}A)-B_{n-1}A

    \therefore \begin{cases}B_0=E\\ B_1-B_0A=a_1E\\ B_2-B_1A=a_2E\\ \cdots\\ B_{n-1}-B_{n-2}A=a_{n-1}E\\ -B_{n-1}A=a_nE\end{cases}

    以A^n,A^{n-1},\cdots,A,E依次从右边乘第1,2,\cdots,n+1式

    得\begin{cases}B_0A^n=EA^n=A^n\\ B_1A^{n-1}-B_0A^n=a_1EA^{n-1}=a_1A^{n-1}\\ B_2A^{n-2}-B_1A^{n-1}=a_2EA^{n-2}=a_2A^{n-2}\\ \cdots\\ B_{n-1}A-B_{n-2}A^2=a_{n-1}EA=a_{n-1}A\\ -B_{n-1}A=a_nE\end{cases}

    将以上n+1个式子一起加起来,左边为零,右边为f(A)

    \therefore f(A)=O\qquad\mathcal{Q.E.D}

    推论:设\mathscr{A}是有限维空间V的线性变换,f(\lambda)\mathscr{A}的特征多项式,则f(\mathscr{A})=\mathscr{O}

    相关文章

      网友评论

        本文标题:高等代数理论基础48:特征值与特征向量

        本文链接:https://www.haomeiwen.com/subject/ybfouqtx.html