时间:2018-08-27
作者:魏文应
一、说明
本章节中, 粗体的 表示向量,常规字体的
表示一个数。
二、矩阵运算
什么是矩阵
把一些数,排列起来放置,组成数表,比如下面这个就是 m 行 n 列的矩阵:
元素 是矩阵A 的第
行
列。
矩阵加法
、
两个矩阵相加,需要这两个矩阵为 同型矩阵(同为 m x n 矩阵),相对应元素相加即可:
数与矩阵相乘
数 与 矩阵
的乘积:
矩阵和矩阵相乘
先举个例子:
矩阵 是一个
矩阵,矩阵
是一个
矩阵。两个矩阵相乘
得到一个
矩阵
:
这就是 矩阵和矩阵相乘。从中我们可以看到,矩阵相乘 和
是不一样的。相乘的前提条件是,前一个矩阵列
数要和后一个矩阵的行
数相等。
三、超平面
超平面,是因为机器学习的几何模型需要超平面这个概念,几何模型的决策面就是一个超平面。至于什么是几何模型、什么是决策面,我们后面再说。我们先从数学角度上看超平面。
有些平面画不出来
由于人眼睛感知的限制,我们只能看到空间的维数 ,比如:一维点
,二维点
, 三维点
,这些点我们可以用 笛卡尔直角坐标系 表示出来,直观看到。等维数
以后,人就不能直观地观察到了。但我们依然沿用这种几何的说法,比如
我们依然可以叫做点。
向量空间
向量 应该都知道,比如平面坐标系中的向量 、三维坐标系中的向量
。在几何中,我们把 “既有大小又有方向的量” 叫做 向量 。现实世界中,我们把空间看做是由一个一个点组成的,这样的空间叫做 点空间 。
维向量的全体组成的集合,叫做
维向量空间,表示如下:
表示实数范围内。也就是说,
表示一些点,把所有的点放在一起,构成的集合,这样的集合,给它取个名字,叫做
维向量空间。在几何上,二维向量空间
是平面空间,三维向量空间
是三维立体空间。我们知道,在三维空间中,可以用
作为一个基本向量,
就可以表示三维空间中的任意向量了。
维向量空间
中:
-
。
-
之间线性无关。
- 向量空间
中任意向量,都可以用
表示。
这样的向量组 叫做 向量空间的基 。此外,下面向量空间:
这个向量空间,数域F 是在 实数R范围内,所以叫做 元实坐标向量空间。相对的,如果数域F是 复数C,那么就叫做
元复坐标向量空间。
线性空间
向量空间,也叫做 线性空间 。向量空间是从几何学的角度去描述,因为向量空间是能够满足线性运算的,所以也叫做线性空间,一般用 表示线性空间。满足下面8个运算规则的运算,称为 线性运算:
-
;
-
;
- 在空间
存在 **零元素
, 对任何
, 都有
;
- 对于任何
,都有
的 负元素
,使得
;
-
;
-
;
-
;
-
;
一般情况下,我们认为向量空间指的就是线性空间,两个名称等价,意思一样。线性空间更加抽象化而已。 维线性空间 记为
。如果
为
的一个 基,线性空间
可以表示为:
我们可以说这个线性空间 ,是由基
生成的线性空间。有些时候,还叫做由基
张成的线性空间 。在向量空间,我们说过 实向量空间,也就是 实线性空间。
子空间
先举个例子:平面 是
的子集,而且
也是一个线性空间,称
是
的 线性子空间。我们知道了,在数域
上 的线性空间
,可以看成是由无数点的集合构成的。我们选择其中一些点,这些点构成的集合
是 线性空间
的子集,这个集合S要 满足封闭性,即:
-
,都有
。
-
,都有
。
这个线性空间 就叫做线性空间V的 线性子空间 。 上面
符号意思是 任意,也就是 “对于任意
” 的意思。符号
是 属于 的意思。
超平面
高中我们就知道, 可以在平面上表示一条线,
可以在三维空间上表示一个面。推广到
维向量空间,无论是线还是面,我们都把它叫做 面 。我们可以把面看做是由无数点组成的:
上面这个向量集合,由这个集合中的无数个点组成 维向量空间的一个面,这个面,就叫做
维向量空间中的
维超平面。为什么是
维 呢? 2维空间(2D)中,
表示的是几何中的直线,线是1维的。3维空间(3D)中,
表示的是几何中的面,面是2维的。你会发现,直线可以把平面分开两半,平面可以把空间分成两半。这就说明它可以分类,在机器学习的分类问题就会用到。

四、向量运算
数量积(内积)
高中,我们就学过: 。这个就是二维空间中,平面向量的数量积(内积)。引入坐标系以后,向量
和向量
数量积就是:
而且向量 和向量
互相垂直 时,有下面公式:
后来我们把数量积推广到了三维空间,对于向量 和 向量
,数量积就是:
如果 ,那么称这个向量
是 平面
的 法向量。如果有一个空间平面,平面方程如下:
那么它的法向量就是 ,解释如下:
设向量
是 平面
的 法向量, 并且和平面
交于点
。平面
上的向量均可表示为:
,因为向量
与向量
垂直,所以:
整理得:
可见,标准方程中,三个未知数的 系数所组成的向量,就是平面的一个 法向量。
前面讲的,是二维空间和三维空间,将 内积计算 推广到 维空间:
内积空间
我们先说什么是 内积。上面我们说,在解析几何中,设 、
,它的内积:
上面公式中,我们规定了一种规则,让两个 向量相乘,得到一个 实数。可以这么说吧,这种规则是 根据自己的需求自定义的 。如果你规定 也是可以的,只要满足你的实际需求就可以了。比如上面,解析几何中的
之所以等于
,是根据对应的实际物理意义定义的,如
是两个向量的夹角,
是向量
的模等等 。这样的规则太随意,我们希望对这个生成规则做一些限制。比如下面规定:
设
是实数域
上的 线性空间,
, 给定 某种规则,使
与
对应于 一个实数,记为
, 且满足下列条件:
,当且仅当
时,
![]()
满足上面的实数
称为向量
和
的 内积 。其中,
,
。
定义了内积的 实线性空间 ,叫做 欧几里德空间。简称 欧氏空间 或者 实内积空间。而对于内积空间中,推广到复数的 复内积空间,这里我们不讨论。我们用得比较多的是 标准内积:
在
维向量空间
中,对于
,
,我们规定:
这个内积,就称为
上的 标准内积。可以这么说,
使用上述内积构成
维欧氏空间。
范数
先看范数的定义:
令 V 是复向量空间。函数
:
称为向量
的 范数 。
什么意思呢?意思就是将一个 向量 计算以后得到一个 实数,至于你怎么计算,你想怎么算都行。我们来例子。令向量 ,对于这个向量,你可以这么计算:
也可以这么算( 绝对值符号,
的绝对值):
总之你开心就好。但是为了是范数使用起来有意义,范数规定:
(非负性)
,当且仅当
(正性)
, 对所有复常数
成立。 (齐次性)
(三角不等式)
满足上面条件的函数,称为 范数 。如果不满足第二条:正性,则称为 向量 的半范数 。我们可能会用到下面范数,
范数 (也叫做 和范数 或者 1范数):
上面等号的 def
是 define
的缩写,意思是 定义
。而下面的 范数 ,也叫做 欧几里德范数 ,我们勾股定理,就是当向量
的范数为
求得的。你会发现,L2范数可以求空间中两点之间的距离。
范数 如下:
下面是 范数(上面
和
范数,就是
和
的情况):
而 范数 (无穷范数或者极大范数):
上面各种范数说明了,向量 的范数,只是一个转换函数而已,由一个向量得到一个数,这种转换根据现实需求而定。比如空间中的点的坐标
,它到原点的距离就是:
上面这个,就是向量 的
范数。我们原来是一个向量
的形式,经过函数
映射关系,得到一个实数
。这个函数
就可以称为 向量
的范数。
五、参考书籍
- 《线性代数(第五版)》- 同济大学 。
- 《矩阵分析与应用》- 张贤达 。
网友评论