https://www.bilibili.com/video/BV1ys411472E?p=14
一、概念
首先,我们假设坐标系的一个基变换。在变换的过程中,空间内大部分的向量都离开了它所张成的空间(即这个向量原点到终点构成的直线) ,还有一部分向量留在了它所张成的空间,矩阵对它仅仅是拉伸或者压缩而已,如同一个标量。
如上图,在给出的例子中,x轴所有向量被伸长为原来的3倍,一个明显留在张成空间内的例子。另一个比较隐藏的,是这个向量,其中的任意一个向量被伸长为原来的2倍。
- 变换中被留在张成空间内的向量,就是特征向量(上例x轴和)
- 其中每个向量被拉伸或抽缩的比例因子,就是特征值(上例3和2)
- 正负表示变换的过程中是否切翻转了方向
二、三维情况下的用途
三维情况,如果能找到这个不变的向量,即旋转轴(特征值必须为1)。把一个三维旋转看成绕某个轴旋转一定角度,要比考虑相应的3*3矩阵要直观得多。
顺带一提,在这种情况下的特征值必须为1。因为此时的旋转并不缩放任何一个向量。
三、特征向量的计算
用符号表示的话,以下就是特征向量的概念:
Av = λ v
A是代表某个变换的矩阵。v是特征向量,λ是一个数,也就是对应的特征值。
这里说一下我个人的理解:对向量v进行了A的线性变换,等价于对v的直接拉伸。要达到这个条件,λ和v都是多少才可以呢?如果我们计算出了这两个值,就可以称λ为特征值,v为相应的特征向量。
为了提取公因式,需要引入单位矩阵,右侧的λv,其实隐含了一个单位矩阵。这个思路仍然是参考了孟岩的理解矩阵第三篇,此处不再引述原文。
现在可以把公式当成Av = λ l v,其中l就是单位矩阵。然后就能提取公因式了:
(A-λ l)v = 0向量
现在对于左侧的新矩阵A-λ l,我们要找到一个向量v,相乘之后变为0向量。在此不讨论v是0向量的特殊情况,根据之前行列式那一节的知识,仅当新矩阵A-λ l代表的变换将空间压缩到更低维度时,v向量和它相乘后才会变成0向量。所以现在的求解,是在求新矩阵A-λ l的行列式为0.
举个具体的例子,假设有个矩阵,列为(2,1)和(2,3) 根据行列式的计算法则ad-bc,就能得到λ为1时,A-λ l的行列式为0.
102-Lambda.gif
1.回到视频最开始的例子,看看如何计算
这个矩阵的列是(3,0)和(1,2),那么新矩阵A-λ l就是:
3-λ 1
0 2-λ
根据行列式公式ad-bc=0时,即(3-λ)(2-λ)-1*0=0,可得λ=2或3.
以λ=2为例,代入矩阵中
根据矩阵乘法进行化简就是x+y=0,这意味着所有的解都落在了由向量(-1,1)张成的直角线上,也就是特征向量是不唯一的,有非常多。与之对应的,就是原始矩阵[(3,0),(1,2)]将这些向量拉伸为原来的2倍。
2.旋转
一个逆时针90度的旋转,每个向量都发生了旋转,离开了其所张成的空间。使用上述规则来计算一下就是:
image.png
这里没有实数解,即没有特征向量。不过是有虚数解的,暂不讨论。
3.剪切
image.pngλ=1是唯一解,也就是特征值为1,感觉上就是剪切时横轴一直没有动。
4.拉伸
如果将所有向量都拉伸为2倍呢,根据上面的计算λ=2是唯一解。
image.png
然后代入回去,就很奇怪:
image.png
可以理解为x,y此时是有无穷解的。这也意味着,平面内每一个向量都是属于这个特征值的特征向量。
5.如果基向量都是特征向量会发生什么
比如,i帽变成原来的-1倍,j帽变成原来的2倍。即:
-1 0
0 2
像这种对角线有值,其他元素全为0的,称为对角矩阵。比如:
image.png
解读它的方法是,所有的基向量都是特征向量,矩阵的对角元是它们所属的特征值。
对角矩阵有一个好处是,矩阵与自己多次相乘的结果更容易计算:
image.png
image.png
相比之下,下面这种相乘100次就是噩梦:
image.png
四、抽象向量空间 克莱姆法则
https://www.bilibili.com/video/BV1ys411472E?p=15
https://www.bilibili.com/video/BV1ys411472E?p=16
这两部分粗略看了一遍,和我关系不大了……
网友评论