线性代数的本质

作者: 时间之友 | 来源:发表于2019-12-07 16:41 被阅读0次

线性代数的本质

一、向量究竟是什么？

向量在不同专业人眼里的样子

计算机人眼中，矩阵不过是一种数据结构，比如记录一片地区的房屋价格，就可以用矩阵表示，实际上也是一种二维向量（其实更深入的探讨，矩阵可以理解为函数）

向量，是有序的数字列表

二、线性组合、张成的空间与基

上一节聊过，矩阵不过是一种向量，我们的向量可以由基向量 i、j 转换而来，那么，我可以通过向量就能描述一个所有的二维空间，这样对于计算来说，太繁琐了。
我们简化一下，用向量的终点表示向量，即一个点，这些点在坐标系上形成了无数矩阵化的点。

三、矩阵与线性变换

如果一种变换满足以下两种条件：1、直线在变换后还是直线，不能弯曲；2、原点保持不变，那么就称为线性变换

我们知道，向量就是矩阵，那么空间中的任意一个向量就该等于它们的基向量的线性变换，也就是一个向量V，可以表示为 v = ai + bj

如图，我们知道任意的i和j，就能推算出来变换后的新矩阵，xy的原基向量不用管，基向量单位为1，那么x和y就是对应的i 和j 的倍数

把i和j放在一起，组成2*2矩阵，矩阵就是这么组合方式

20200215更新：如图，首先一个二维向量v可以理解为 v = ai + bj 的模式，则可推广出 [x y] 这个向量与 [ac bd] 相乘，即线性变换，x对应i：ac，y对应j:bd作为的基向量变换，x,y分别变换一次，综合得出线性变换的结果，简单易懂，轻松理解乘法，不用死记硬背 (线性变换)

上图的意义是什么？上图中 ac 和 bd 可以当成是线性变换后的 i、j基向量，我们不用管之前的xy基向量是啥，只知道之前的基向量下的某个向量值为 xy (没法按矩阵竖着写出来，用横着写默认表示竖着写的矩阵) ，之前的基向量线性变换后成了新的基向量 ac 和 bd，那么原来的xy线性变换后的新的x y是什么？就是上图的表达式：二者的乘积。

矩阵的乘法的意义就是表示了空间向量的线性变换。它只有在（从左向右）第一个矩阵的列数（column）和第二个矩阵的行数（row）相同时才有意义，譬如一个m * n矩阵和一个n * s矩阵的乘积，就是一个m * s的矩阵（矩阵乘法是从右向左，注意区分）。

四、矩阵乘法与线性变换复合

上节我们提到一个 2*2 的矩阵乘以 1*2 矩阵，那么对于 2*2的两个矩阵相乘，它的意义是什么？

我们设想，对于一个1*2矩阵，我们不管它的初始i、j，我们记住它变换了一次[abcd]，再变换一次[efgh]，那么这个矩阵会变成什么样子？

一个任意的向量，经过一次旋转动作，得出新的 i j，再经过一次剪切动作，得出i j，最后得出新形成的复合的 i j，约掉该任意向量，得出如图结果，注意这个过程可以看出函数f(g(x)),所以矩阵有严格顺序

如图，拆分来看，复合矩阵，先对 i 进行操作

如图，再对j 进行操作，最后重新组成新的二维向量

对于复合的线性变换，之前我们算过，[x,y] 可以约去，不用关心，那么我们只需关心复合变换后的各自 i、j，比如图中M1，我们可以把它拆解嘛，先看它的i经过M2变换后的得到的i,再看它的j经过M2变换后得到的j（以上属于复合变换）

矩阵 AB ≠ BA

附录：三维空间的线性变换

三维空间的线性变换和第四节提到的一样，就是二维的维度多一次复合变换，可以拆解，从又往左看。

如图，从右往左看，绿字是三维矩阵，因为有3行，但是只有i j，表示三维空间中i j 组成的这个二维平面矩阵。红字矩阵实际上是二维空间的二维矩阵，矩阵的意义表示二维空间的3个向量的组合。先拆解绿字矩阵，绿i要经过红字矩阵变换（实际也是通过红色向量ijk变换）后得出新矩阵（向量），计算的时候，先看绿i向量在红矩阵组合向量的变换下，最终得出什么样的向量，再看j向量在红矩阵组合向量下得出什么新向量，再把得到的新i新j一合组成新矩阵，就是我们要的结果，所以最终结果是2*2矩阵

五、行列式

什么是行列式？百度的定位看起来很复杂，便于理解，我们可以先在一个二维空间画一块blob，这个区域实际上可以理解成矩阵，由很多小块矩阵各自拼接出来的。那么，现在我们进行线性变换，这个blob面积就会发生变化，行列式就是表示这个面积的缩放比例。在三维空间，即三阶矩阵中，行列式表示体积缩放的比例。

如图，det行列式如果结果是数字，表示缩放比例，结果是零，表示此时面积为0，或者是空间直线向量或者是点

那行列式的值如何计算？比如这个二阶矩阵，实际上就是i,j 两个向量嘛，i坐标x=a,y=c; j坐标x=b,y=d，那么它们和原始的i(x=1,y=0)j(x=0,y=1)相比，它们的放大比例就是 ad-bc

上面这段怎么理解？实际上就是两个i j 向量各自组成的面积块中，通过几何一算即得出 ad-bc 这样的公式。det就是对i j 的拉伸。

六、逆矩阵、列空间与零空间

图左边，这样没有xy,没有x^2这种形式，只是乘法和加法，称为线性方程组，可以把这个方程组变成图右边的矩阵，红ijk三维空间只变化i，变成新的绿i，最后结果是一个三维空间的一维向量[-3 0 2]，那如何求出这个x→ ？这就需要引入逆矩阵。

逆矩阵与矩阵可形象表述为倒带和正放，就是在空间中我反向向旋转一下，再正向旋转一下，最后的结果不变。记住矩阵乘法是在左边加新矩阵，从右往左算，如图，左边一逆一正等于1，什么也没有，那么求x→ 就变成了A逆和向量的乘积了

即使不存在逆运算（逆矩阵），也可能有解，比如说一个变换将空间压缩成直线，

秩：秩精准定义是矩阵的列张成的空间维度数。当秩与列数相同时候，我们成为满秩。注意定义里的张成二字，非满秩的情况下，比如虽然矩阵是2个列，但这个2个列正好在几何上处于一条直线，张成的是一条线，那实际上是一维，秩是1，就没满。

当逆变换存在时，你能用逆变换求解方程组；否则，列空间的概念让我们理解什么时候存在解；零空间的概念有助于我们理解所有可能的解的集合是什么样子。

附录：非方阵

前面几章提到的矩阵，要么是二维到二维的变换，要么是三维到三维的变换，那么可否一个二维向量变成三维向量？

如图，这个矩阵的意义是什么？它的列只有i j，但是ij里面又有了xyz三行,该矩阵的意义为三维空间中的过原点的二维平面，但是该矩阵我们仍然认为是满秩的，因为列空间的维数和输入空间的维数相等（这句话如何理解？我们想的是这个矩阵的意义，可以通过线性变换来理解，那么某个矩阵通过该矩阵进行线性变换，则某个矩阵的行数必须要等于该矩阵的列数，即2，那么某个矩阵它必须是2维度的，这某个矩阵通过这个矩阵进行线性变换，某矩阵是2维的，这个矩阵是3维的，它表示的意义就是某个二维矩阵通过这个三维矩阵进行线性转换，也就是这个二维矩阵通过这个矩阵映射到三维矩阵上）

与上面相反，这个图的矩阵表示原向量是三维空间的，因为它有3列，有两行表示这个基向量在变换后变成二维空间，因此这是一个三维空间到二维空间的变换

七、点积与对偶性

注意，点积不是乘法，中间有个点哦，注意和矩阵乘法区别。矩阵乘法的要求是参与相乘的左矩阵的列数必须跟右矩阵的行数相同,即 A (M x N) 乘以 B (N x K) 的乘积矩阵C 为 M x K 维的。矩阵乘法结果矩阵的每个元素都是向量的内积,cij = <ai, bj>, 即A的第i行向量和B的第j列向量的内积。矩阵点乘则要求参与运算的矩阵必须是相同维数的,是每个对应元素的逐个相乘。

点积百度百科-感觉解释的一般般

点积可以想象成投影，那么v*w其实是v在w上的投影与w相乘，当两者垂直，点积为0，两者放心相反，点积为负

如图，相当于w在v上的投影，将w投影的长度与v 长度相乘，就得出点积，对于图中点积，可以看成vw共有4个输入量，最后输出一个输出值的函数，啥意义呢？它可以表示多维向量跌落到一维（数轴）的过程

这里，可以给我们启发，如果你看到一个向量线性变换后的结果是一维数轴，空间中会存在唯一的向量V与之相关，就这一意义而言，应用变换和与向量V做点积是一样的

点积可以干什么？两个向量的点积为正，表示朝向类似，为零，表示朝向垂直，为负，表示朝向相反。点积满足线性变换，具有对偶性，v.w和w.v的结果是相同的，最终结果为实数。
前面，我们学了矩阵的乘法，那矩阵的点积和乘法到底啥区别？矩阵的乘法表示线性变换；而矩阵点积则是表示2个相似向量，其中一个向量的相对对方的投影长度和对方向量的自身长度相乘，所得数字即为点积。
补充：矩阵的点积和叉积在麦克斯韦方程组即流体、空气、电磁学里能应用，用以计算散度和旋度。

八、叉积的标准介绍

两个向量叉积，结果就是他们围城的面积，这就是叉积的意义（叉积的值除了能表示面积外，还等同于从原点出发垂直于该面积且长度等于面积的向量，向量的方向复合右手定则），叉积是有顺序的，V✖️W= -W✖️V。行列式的定义是向量线性变换后的面积放大倍率，而通过叉积即可求出行列式

注意，叉积和前面的行列式对应上了。叉积的结果不是一个数，而是一个向量，这个向量垂直于张成的平面，长度是结果的数字，方向遵循右手定则。图中V是[-3 1]，W是[2 1]，求这个两个向量的叉积就等于求后面矩阵的行列式

点积和叉积是什么关系？三维空间中，当你将 P 向量和（x,y,z）向量点积时，所得的结果等于一个3*3的矩阵的行列式，即所得结果等于 (x,y,z) 与v、w确定的有向体积

接着上图，我们再梳理一下，求叉积就是求3个向量围城的立方体的体积，即，我们先求v和w组成的面积，然后这个面积要和(x,y,z)向量相对vw组成的面积的垂直分量的长度相乘，也就是说，求 (x,y,z) 在 vw上垂直的向量的投影，而此时我们想想点积的定义，点积不就是一个向量在另一个向量上的投影吗？
OK，接着上图，那么(x,y,z)要投影到一个垂直于vw组成面积的向量上，然后与这个向量点乘，根据点乘定义，即是求(x,y,z)在这个向量上的投影长度和这个向量自身长度相乘。我们再想想，那么这个P该是什么样子呢，这个P应该是vw的叉积（三维空间叉积的结果是相对于一个平面的有向垂直向量）

P就是vw的叉积

总之，这就解释了我求 vw的叉积，为什么等于求(i,j,k) v,w 三个向量的行列式，即点积，这个图中的(i,j,k)对应上面图中的(x,y,z)，凭空出现的(i,j,k)最后约掉了

补充：叉积得到的两个向量组成的平行四边形的面积大小的正负，就是拿来判断这两个向量在右手系坐标下的位置，因为我们习惯了右手系的的坐标系，我们用的直角坐标系是右手系的。叉积正如视频作者讲的，是行列式之后发现的，是数学符号，至于生成的新向量，在数学上是和那个行列式等价的，新向量的几何意义就是代表一个轴，与角动量联系起来的话，就是旋转轴，正负代表角动量的方向，大小就是角动量的值

九、基变换

如何在不同的坐标系之间切换？这里涉及到仿射变换。
矩阵乘法就是一个特殊的线性变换。比如，你当前坐标下有向量V ，为求空间扭转（也就是线性变换后）后的V的值，只需要知道空间扭转后的坐标系ij等，然后[ ]V 两者相乘即可得出V 变换后新的坐标。

在你看到一个公式，是这样的格式：A逆乘以 M 乘以 A，这按时熟悉上的转移作用。

相似矩阵。从右往左读，意义是某V向量，在A坐标系下是什么样子，然后通过M变换一下，再乘以A逆回到V原始的坐标系下。说白了是啥意思呢？有个未知坐标系下的V 在已知的M坐标系下进行一次线性变换，变换后再倒腾会原始坐标系下，看看V此时状态下是什么值

十、特征向量与特征值

什么是特征向量？一个坐标系下的某向量，在该坐标系扭转后仍然方位不变，则称为该向量为特征向量。用三维空间比较好了解，一块正方形，任意一条向量穿过正方形圆心，绕着该向量旋转放大，而该向量不动，则该向量为特征向量，或者说该向量是旋转轴。而这条向量放大缩小了多少，这个就是特征值。

向量V是A的一个特质向量

有些矩阵没有特征向量，比如[1,0 0,1]，它旋转90度后，所有向量都旋转了，没有向量保持不变，这种就没有特征向量。

如图为对角矩阵，什么是对角矩阵？就是假设一个矩阵，它的基向量就是特征向量，在几何中就是基向量可以伸缩或者为负反方向调整，这样，生成的一个新的坐标下，之前的基向量都是特征向量，它的特点就是对角线的数字对应着不同基向量的特征值，这个要结合视频更好理解

一来一回，d就是b的对角矩阵，说白了某向量经过c变换后再经过b再逆矩阵a，得到的是一个基于b的基向量的矩阵，这个矩阵和 b 是对角矩阵

十一、线性代数的本质：抽象向量空间

矩阵可以理解为函数。

函数的求导是线性的，那么我可以用矩阵来表示求导

线性代数的本质