Convex Optimization 这本书非常有意思,它是线性代数,几何学,集合论,数学分析的综合。
第二章
2.1 这部分是在用数学分析和集合论的语言定义一些
维空间的几何体。
2.1.1 定义线和线段
2.1.2 定义仿射集合
仿射集合有如下性质:
连接仿射集合中的任意两点成一条直线,那么直线上任意一点也在该仿射集合内
对应的几何体是:点,直线,超平面(hyperplane),有offset的线性子空间(subspace)
最后得出的结论很有意思:
Every affine set can be expressed as the solution set of a system of linear equation
即
If a set
is affine, then it can be expressed as
2.1.3 介绍了仿射体的维度,其实就是线性子空间的维度。
2.1.4, 2.1.5, 2.2.1, 2.2.2, 2.2.3, 2.2.4 介绍了凸体(Convex Set),椎体(Cone),超平面(hyperplane),半空间(halfspace),球体(ball),椭圆体(ellipsoids),多面体(polyhedra) 等等。
凸体的数学定义为:
If
, let
, for any
,
, then
is convex.
Any line segments constructed from any two points in the set are within the set, then the set is convex.
介绍多面体的时候提到了Simplex,对应的是一维的线段,二维的三角形,三维的四面体等等。
它其实是由k个affinely independent的点组成的凸包,亦即,从这k个点中任取三个点组成一个超平面,那么其他所有点不能在这个超平面内。
2.3 介绍了一些保持Convex Set的convexity的operation。主要有:交集运算,仿射(translation, scaling and projection),linear-factional.
If
are convex sets, then
is convex.
Ifis convex set, then
is convex
Ifis convex set, then
is convex.
理解起来很简单。相当于线性变换。对
做奇异值分解,得到
, 其中
为旋转操作,
为缩放操作,
为平移操作。几何体经过旋转,缩放,旋转再平移之后,它的convexity不变。
再看 ,需理解
这个操作。
代表一个超平面,
得到的绝对值代表离超平面的远近,正负号代表在超平面哪一侧 。那么
这个操作的意思是,离平面越远的点我会让它离原点越近,离平面越近的点我会让它离原点越远。这里保证了定义域在平面的正侧。
证明的方法很简单,根据定义即可。
简单证明下linear-factional function reserves convexity.
Let
, then
for any
.
After transformation,
, we want to show that
and
Expanding above equations:
By comparison, we get
And indeed we can showsince
,
and
2.5 超平面分割定理
If
are convex sets, and
, then there exists a hyperplane
such that
for any
and
for any
.
证明书上有。
由此引出仿射体和凸体的分割:
is convex and
is affine. If
, then there exists
such that
and
for all
.
证明见 Example 2.19. 文中用了一个直观的事实:即如果 ,这里
是constant vector and constant scalar,那么
.
由此再引出以下:
无可行解
- For
and
,
(1) 和 (2) 是等价的
很直观的理解,,
代表不等式左边的空间,D代表不等式右边的空间,他们不可能有交集的,否则交集中的点可令不等式成立。
(2)不就是前面证明的仿射体和凸体的分割么,他们无交集的话,那不就可以根据平面分割定理引出一些东西?
For
and
, if
, then there exists
for any
and
for any
.
The first inequality shows thatfor all
, which implies
,
.
The second inequality showsfor all
implies
and
and
.
Fromand
we can show
.
也就是,以下两个只有一个能成立:
有可行解
这里是不是有对偶的感觉了?
第四、五章
优化问题的标准形式
对于和
组成的交集,如果其不为空,则这个问题是可行的。
对于非标准形式,比如其可转为为标准形式
用拉格朗日乘数,解法很简单,设:
标准形式的对偶函数即为:
这里,对于, 标准形式的解
,这个很容易证明。
求解的话,对求梯度,令其等于零,求得
代入
即可求得
,这里利用了
是concave的性质。
那么对于LP的标准形式,
易得
那么
因为,LP的标准形式对偶形式为:
我们称其解为.
若 ,我们称其为弱对偶。
若 , 我们称其为强对偶。
对于形如
的问题,如果 是convex 的,那么强对偶一般都成立。
对于形如
的LP,其对偶形式为:
我们来其分析其对偶性。这里无非有这么几种情况:
-
,即问题无可行域。
如果不用几何性质,证明就简单多了。
那么
。
因为对应的是线性子空间,
是对线性子空间朝
方向平移,那么
意味着平移之后与
无交集,
。所以到底是如何平移的呢?想象把
平移到
,平移方向有垂直于子空间的分量,且存在子空间的某个法向量,使得这部分分量与这个法向量的方向相反,即存在
的某一列
(
的某一行),使得
, 或者
。如果对偶形式有可行域,则意味着
在
的零空间内,且方向为正,而显然
在
的零空间内有正向的分量,这就使得
,所以
。
因此,在LP无可行域的情况下,其对偶形式要么无可行域,要么是无界的。 -
存在
使得
,即
是无界的。此时,如果原LP无最优解,那么
不可用
的列向量正线性组合来表示,这意味着对偶形式无可行域。如果原LP是有界的,那么肯定有最优解,其对偶形式有可行域,且有解。
-
是有界的。这种情况下原LP肯定有解,且对偶形式也有解。
如果理解了正交补,证明以上就变得很简单。维基百科的正交补定义:
对于的子空间
,
的正交补为
定义为:
对于的矩阵
来说,记
为其行,列,零空间,则
对应LP的及其对偶问题,
读者可以用以上性质自证的情况。
网友评论