线性代数
矩阵
1.矩阵的加法
设是两个矩阵,则 矩阵称为矩阵A
2.矩阵的数乘
设是矩阵,是一个常数,则矩阵称为数与矩阵A的数乘,记为。
3.矩阵的乘法
设是矩阵,是矩阵,那么矩阵,其中 称为的乘积,记为 。
4.向量的内积及正交性
两个向量的内积=两个向量的模相乘,再乘以,角度为两个向量的夹角。如果两个向量垂直,则内积为0
其中: 如果n阶方阵A满足, 即A的转置等于A的逆,则A是正交矩阵。
5.矩阵乘法运算律
乘法结合律:A(BC)=(AB)C
左分配律:(A+B)C = AC+BC
右分配律:A(B+C)= AB+AC
注意:两个矩阵相乘,要保证:前一个的列数=后一个的行数
一般情况下: 6.特征值和特征向量的概念及性质
(1) 设是的一个特征值,则 有一个特征值分别为 且对应特征向量相同(A^{T}$ 例外)。
(2)若为的n个特征值,则 从而没有特征值。
(3)设为的个特征值,对应特征向量为,
若:
则:
7.转置
8.特殊矩阵
- 下三角矩阵:左下角都是非零元素
- 上三角矩阵:右上角都是非零元素
- 对角阵:对角线是非零元素
- 单位矩阵:对角线上都是1,其余是0
9.方阵的迹tr
- 方阵的迹为对角线元素之和
-
性质:
10.矩阵秩
矩阵的秩:该矩阵中线性无关的列向量的数目
(1) 秩r(A)=行秩=列秩;
(2)
(3)
(4)
(5) 初等变换不改变矩阵的秩
(6) 特别若
则:
(7) 若存在 若存在
若 若
(8) 上面的式子只有零解
11.空间
空间是无穷多个向量构成的集合,满足性质:
- 每个向量线性无关
- 每个向量可以由其他的向量进行线性表示
12.向量的范数
- p=1,表示1范数
- p=2,表示2范数
- p为无穷,表示无穷范数
13.矩阵的范数
假设:
F范数表示为 性质:
最小二乘法
给定数据集合: 构建线性回归模型:
- 表示观测值
- 表示估计值
残差(residual): 残差不是指距离,直接两个y值相减即可。
SSE (sum squares of error): 最小二乘法就是使得残差平方和最小的直线模型。可以求出k、b的值
最小二乘法求解两个参数k,b
- 先对b求导
- 再对k求导
- k的另一种表示方法
在上面k的表达式子中
MLYTISpng总结上式子推导过程:
- k 的另一种表达式为:
最小二乘法和最大似然估计的关系
最小二乘法是残差满足正态分布情况下的最大似然估计
参数服从正态分布
残差的概率密度函数为:
似然函数表示为:
对数似然函数为:
最大似然函数为:
凸优化
优化问题简介
机器学习流程
- 建模
- 优化问题
- 复杂优化问题(非凸的,不熟悉的)
- 简单优化问题(低纬度优化,约束条件的简单优化,已知答案的优化)
优化问题的一般形式
- 求解最小值
- 给定某个条件:
优化问题实例
image凸集合和凸函数
凸集合:如果一个集合上的任何两个点之间的线段上的任何一点还在这个集合中,那么这个集合就是凸集合。
凸函数:如果一个函数的定义域是凸集合,而且对于任何两个点以及两点之间的线段上的任意一点都有 比如开口向上的二次函数
函数的上镜图:上镜图就是函数图像上方的部分区域
凸集合和凸函数的关系:一个函数是凸函数当且仅当函数的上镜图是凸集合。
凸组合
对于任何的n个点以及权重系数,权重系数小于0,且所有的权重系数之和为1,则S称之为凸组合:
物理意义:n个重心为的点的整体重心
凸性质
-
凸集合形式:假设是一个凸集合,那么它的任意自己都是凸包都仍然包含于
-
凸函数性质:琴生不等式
如果是个凸函数,则对于任何以及凸组合都有:
-
凸函数性质:
局部极值肯定是全局极值;非凸函数的局部最优解未必是全局最优解
凸优化问题
凸优化问题的一般形式:
- 目标最小化f(x)
- 给定条件
对偶问题
拉格朗日常量
拉格朗日对偶函数
KKT条件
在某个约束条件g(x) \leq 0的情况下最小化f(x),转化为如下的形式:
上面的条件称之为KKT条件
demo
给定约束条件 求解下面函数的最值
- 拉格朗日函数
- 求出梯度
- 梯度为0
表示为3个分量分别为0
得到了:
将x,y,z带入式子x2+y2+z^2-1=0中,可以求出v,从而得到
网友评论