干货 | 10分钟带你彻底了解column generation

作者: 番茄鸡蛋炒饭被抢注啦 | 来源:发表于2019-07-25 21:09 被阅读0次

干货 | 10分钟带你彻底了解column generation
线性规划技巧: 列生成(Column Generation)
架构师带你彻底了解docker？
Conditional Generation by RNN &
11.Conditional Generation by RNN
2018-02-24
【雷傲读书】游戏化思维
02 异步通讯设计
MVP的四级台阶
了解MySQL6种约束的不同和特点

OUTLINE

前言
预备知识预警
什么是column generation
相关概念科普
Cutting Stock Problem
CG求解Cutting Stock Problem
列生成代码
reference

00 前言

这几天勤奋的小编一直在精确算法的快乐学习之中不能自拔。到列生成算法这一块，看了好几天总算把这块硬骨头给啃下来了。然后发现网上关于列生成的教学资料也不是很多，大部分讲的不是那么通俗易懂。所以今天就打算写一写这个算法，尽可能写得通俗易懂。

01 预备知识预警

由于列生成算法涉及的知识点非常多，所以在开始之前希望读者必须要具备以下的基础知识，不然就没法往下玩了：

线性规划以及线性规划对偶问题
单纯形法原理
原问题的影子价格（shadow price）以及对偶变量
单纯形法非基变量进基时非基变量检验数（reduce cost）的计算

以上内容我就不展开科普了。如果对这些概念还有不熟悉的小伙伴，一定要回去搞清楚再往下看哦。

Cutting Stock Problem[1]

讲column generation怎么可能少得了Cutting Stock Problem这个经典的问题呢！在开始之前我们将以这个问题为铺垫一步一步往下讲解。

我们有以下问题，原纸卷每个长为L=17m，顾客们分别需要25个3m长，20个5m长，18个7m长的纸卷。那么需要怎样切割才能使得浪费最小呢？

建模

Column Generation Formulation：
对于一卷纸，可以有很多种切割方案。

$a_{ij}$ 表示第j种方案里类别i的个数。
$y_{j}$ 表示第 j 种方案的选择个数。

于是，我们得到如下模型：
$min (y_1 +...+y_n) \\ a_{11}y_1+...+a_{1n}y_n \ge 25 \\ a_{21}y_1+...+a_{2n}y_n \ge 20 \\ a_{31}y_1+...+a_{3n}y_n \ge 18 \\ y_i \in Z$

从上面的模型中，所有可行的裁剪方案的总数为n，我们并不知道这个值是多少，也不需要知道，只需要知道它很大。并且，随着一卷纸长度的不断增加，n是爆炸式增长的。

总之，可行的裁剪方案非常多，在上面的模型中我们无法显式地把所有裁剪方案给表现出来。

02 什么是column generation？

2.1 相关背景

Column generation 是一种用于求解大规模线性优化问题的非常高效的算法。[3]其理论基础是由Danzig等于1960年提出。本质上而言，列生成算法就是单纯形法的一种形式，是用来求解线性规划问题的。列生成算法已被应用于求解如下著名的NP-hard优化问题：机组人员调度问题(Crew Assignment Problem)、切割问题(Cutting Stock Problem)、车辆路径问题(Vehicle Routing Problem)、单资源工厂选址问题(The single facility location problem )等。

2.2 larger linear programs

在某些线性优化问题的模型中,约束的数目有限，但是变量的数目随着问题规模的增长会爆炸式的增长，因此不能把所有的变量都显性的在模型中表达出来。

比如刚刚介绍的Cutting Stock Problem的模型。随着一卷纸长度的不断增加，行的裁剪方案数量是爆炸式增长的。并且，可行的裁剪方案非常多，在模型中无法显式地把所有裁剪方案给表现出来。

2.3 column generation

单纯型法虽然能保证在数次迭代后找到最优解，但像Cutting Stock Problem这一类的问题，由于变量太多根本无法把所有的变量都显性的在模型中表达出来。所以单纯形法在这里就无能为力了。

再有，在用单纯形法求解这类线性规划问题时，基变量(basic variable)只与约束的个数相关，每次迭代只会有一个新的非基变量(non-basic variable)进基，因此，在整个求解过程中其实只有很少一部分变量会被涉及到。

因此，有人基于单纯型法提出了列生成算法。其思路大概如下：[1]

先把原问题P_0给restrict到一个规模更小（即变量数比原问题少的）的P_1，在P_1上用单纯型法求最优解，但是此时求得的最优解只是P_1上的，并不是P_0 的最优解。
此时，就需要通过一个subproblem去check在那些未被考虑的变量中是否有使得reduced cost小于零的？如果有，那么就把这个变量的相关系数列加入到P_1的系数矩阵中，回到第1步。

经过反复的迭代，直到subproblem中的reduced cost rate大于等于零，那么原问题P_0就求到了最优解。

看算法流程图会更加直观哦：[2]

03 相关概念科普

刚刚讲的内容涉及到了几个概念，master problem，linear master problem(LMP)，restricted linear master problem，subproblem等，这一节来把这几个概念给讲清楚。还是基于上面的Cutting Stock Problem的模型：
$min (y_1 +...+y_n) \\ a_{11}y_1+...+a_{1n}y_n \ge 25 \\ a_{21}y_1+...+a_{2n}y_n \ge 20 \\ a_{31}y_1+...+a_{3n}y_n \ge 18 \\ y_i \in Z$

3.1 master problem(MP)

对于一般问题而言，如果要用列生成求解，一般需要重新建模成set covering model。也就是和上面的Cutting Stock Problem类似形式的模型。重新建模成set covering model以后的问题就是master problem了。在Cutting Stock Problem中由于一开始就是建成这种形式，所以其Master Problem就是原模型：
$min (y_1 +...+y_n) \\ a_{11}y_1+...+a_{1n}y_n \ge 25 \\ a_{21}y_1+...+a_{2n}y_n \ge 20 \\ a_{31}y_1+...+a_{3n}y_n \ge 18 \\ y_i \in Z$

3.2 linear master problem(LMP)

Column generation 是一种用于求解大规模线性优化问题的。而上面的模型中，决策变量是整数，因此要用列生成算法的话，要把整数变量给线性松弛了。得到linear master problem：
$min (y_1 +...+y_n) \\ a_{11}y_1+...+a_{1n}y_n \ge 25 \\ a_{21}y_1+...+a_{2n}y_n \ge 20 \\ a_{31}y_1+...+a_{3n}y_n \ge 18 \\ y_i \ge 0$

3.2 restricted linear master problem(RLMP)

把LMP给restrict到一个规模更小（即变量数比原问题少的）的就是restricted linear master problem了。比如可以用启发式算法，在上面的linear master problem找出满足条件（也就是形成的restricted linear master problem必须要有能满足LMP所有约束的可行解）的k个列，得到如下的restricted linear master problem：
$min (y_1+y_2+...+y_k) \\ a_{11}y_1+...+a_{1k}y_k \ge 25\\ a_{21}y_1+...+a_{2k}y_k \ge 20 \\ a_{31}y_1+...+a_{3n}y_n \ge 18 \\ y_i \ge 0$

可以看到，相比原来的linear master problem，restricted linear master problem相当于把 $y_{k+1}...y_n$ 强制限制为非基变量了。[4]

3.3 subproblem

核能预警，如果这部分看不懂，请确保预备知识过关。如果预备知识不过关，请在运筹学老师的陪同下观看，谢谢合作！

上面的限制主问题求解完成后，我们想使用单纯型法进行基变量的转换，看看 $y_{k+1}...y_m$ 中，是否有可以转入基变量的列。还记得怎么找进基的非基变量吗？（不记得就去问你们的运筹学老师）。当然是通过非基变量的检验数辣，通过 $\sigma_j = c_j - c_BB^{-1}a_j$ ，在 $y_{k+1}...y_m$ 中寻找检验数最小并且为负数的变量，将变量对应的那一列添加到RMP中。

那么，在检验数的计算公式中，大家还记得 $c_BB^{-1}$ 是什么吗？ $c_BB^{-1}$ 有两重含义：

通过求解RLMP问题得到的影子价格（shadow price）。
通过求解RLMP对偶问题得到的对偶变量(dual variable)。

所以在开始之前小编一直强调预备知识一定要过关。这两个含义意味着我们有上面两种方式得到 $c_BB^{-1}$ ，不过我们一般倾向于使用第二种，WHY？

虽然通过单纯型法直接求解restricted linear master problem能得到

c_BB^{-1}

。但是restricted linear master problem也可能是一个变量很多的线性规划。为了加快求解速度，通过单纯型法求restricted linear master problemde的对偶问题（将restricted linear master problem对偶一下，就能使得变量数大幅减小，因为这些变量转换成了对偶问题中的限制条件了），能更快地得到子问题想要的

c_BB^{-1}

。[1]

所以我们总结一下：
通过求解RLMP问题或者RLMP对偶问题，得到我们想要的 $c_BB^{-1}$ 以后，subproblem就是通过 $\sigma_j = c_j - c_BB^{-1}a_j$ 这条公式，在 $y_{k+1}...y_m$ 中寻找检验数为负并且最小的变量，将变量对应的那一列添加到RLMP中。

3.4 算法流程图

通过上面讲了这么多以后，这里在给出一个更详细的流程图：[5]

04 CG求解Cutting Stock Problem

通过上面的问题分析和建模以后，我们这一步一步一步来求解该问题，让大家彻底理解column generation这个过程。该过程模拟需要用到一个线性求解器，大家还记得小编以前讲过的lpsolve的教程吗?赶紧去翻一下以前的教程，把lpsolveIDE装上，然后跟着小编的脚步一步一步往下走。

4.1 restricted linear master problem(RLMP)

前面我们完成了问题的建模，得到了Cutting Stock Problem的linear Master Problem。现在，我们可以用启发式算法找到一个满足客户需要的初始解：
首先，一个卷筒有三种切割方案：
方案1：切成5个3m
方案2：切成2个6m
方案3：切成2个7m

很容易得出，5个方案1、10个方案2、8个方案3，是能满足所有客户需求的。即得LMP的一个RLMP如下：
$min (y_1 +...+y_3) \\ a_{11}y_1+...+a_{13}y_3 \ge 25 \\ a_{21}y_1+...+a_{23}y_3 \ge 20 \\ a_{31}y_1+...+a_{33}y_3 \ge 18 \\ y_i \ge 0$
其中，
$a_{11} = 5,a_{12} = 0, a_{13} = 0 \\ a_{21} = 0,a_{22} = 2, a_{13} = 0 \\ a_{31} = 0,a_{32} = 0, a_{13} = 2 \\$
这三列分别对应着方案1、方案2、方案3。还有一点需要注意的，对于每一列，都需要满足：
$3a_{1j} + 6a_{2j}+ 7a_{3j} \le 16$ ，也就是每一卷纸只有16的长度，不能超出这个长度。这个叫列生成规则，不同问题有不同的规则约束。subproblem在寻找某些列或者生成某些列时，就是受到列生成规则的约束的。

4.2 开始列生成过程

iteration 1

RLMP：
$min (y_1 +...+y_3) \\ 5y_1+0y_2+0y_3 \ge 25 \\ 0y_1+2y_2+0y_3 \ge 20 \\ 0y_1+0y_2+2y_3 \ge 18 \\ y_i \ge 0$
将该模型输入lpsolve，得到对偶变量如下：

得到 $c_BB^{-1} = [0.2, 0.5, 0.5]$ 。现在要找一列加入RMP，是哪一列呢？现在还不知道，我们暂记为 $\alpha_4 = [a_{14},a_{24},a_{34}]^T$ 。非基变量检验数 $\sigma_4 = c_4 - c_BB^{-1}\alpha_4 = 1 - 0.2a_{14}-0.5a_{24}-0.5a_{34}$ 。

subproblem：
$min (1 - 0.2a_{14}-0.5a_{24}-0.5a_{34}) \\ s.t. 3a_{14} + 6a_{24}+ 7a_{34} \le 16 \\ a_{ij} \in Z$
求解结果得 $\alpha_4 = [1,2,0]^T, \sigma_4= -0.2 < 0$ ,reduced cost 为负数，因此将 $\alpha_4$ 加入RLMP，开始第二轮迭代。

iteration 2

RLMP：
$min (y_1 +...+y_3+y_4) \\ 5y_1+0y_2+0y_3 +1y_4\ge 25 \\ 0y_1+2y_2+0y_3+2y_4 \ge 20 \\ 0y_1+0y_2+2y_3+0y_3 \ge 18 \\ y_i \ge 0$
将该模型输入lpsolve，得到对偶变量如下：

得到 $c_BB^{-1} = [0.2, 0.4, 0.5]$ 。现在要找一列加入RLMP，是哪一列呢？现在还不知道，我们暂记为 $\alpha_5 = [a_{15},a_{25},a_{35}]^T$ 。非基变量检验数 $\sigma_5 = c_5 - c_BB^{-1}\alpha_5 = 1 - 0.2a_{15}-0.4a_{25}-0.5a_{35}$ 。

subproblem：
$min (1 - 0.2a_{15}-0.4a_{25}-0.5a_{35}) \\ s.t. 3a_{15} + 6a_{25}+ 7a_{35} \le16 \\ a_{ij} \in Z$
求解结果得 $\alpha_5 = [1,1,1]^T, \sigma_5= -0.1 < 0$ ,reduced cost 为负数，因此将 $\alpha_5$ 加入RLMP，开始第三轮迭代。

iteration 3

RMP：
$min (y_1 +...+y_3+y_4+y5) \\ 5y_1+0y_2+0y_3 +1y_4+1y_5\ge 25 \\ 0y_1+2y_2+0y_3+2y_4+1y_5 \ge 20 \\ 0y_1+0y_2+2y_3+0y_3 +1y_5\ge 18 \\ y_i \ge 0$
将该模型输入lpsolve，得到对偶变量如下：

得到 $c_BB^{-1} = [0.2, 0.4, 0.4]$ 。现在要找一列加入RLMP，是哪一列呢？现在还不知道，我们暂记为 $\alpha_6 = [a_{16},a_{26},a_{36}]^T$ 。非基变量检验数 $\sigma_6 = c_6 - c_BB^{-1}\alpha_6 = 1 - 0.2a_{16}-0.4a_{26}-0.5a_{36}$ 。

subproblem：
$min (1 - 0.2a_{16}-0.4a_{26}-0.5a_{36}) \\ s.t. 3a_{16} + 6a_{26}+ 7a_{36} \le16 \\ a_{ij} \in Z$
求解结果得 $\alpha_6 = [5,0,0]^T, \sigma_6 = 0$ ,reduced cost 不为负数，因此不用将 $\alpha_6$ 加入RLMP，列生成算法结束。

最终，我们求解最后一次迭代的RLMP：
$min (y_1 +...+y_3+y_4+y_5) \\ 5y_1+0y_2+0y_3 +1y_4+1y_5\ge 25 \\ 0y_1+2y_2+0y_3+2y_4+1y_5 \ge 20 \\ 0y_1+0y_2+2y_3+0y_3 +1y_5\ge 18 \\ y_i \ge 0$

得到RLMP的最优解 $y = [1.2, 0,0,1, 18]$ ，这里因为把MP的整数决策变量给线性松弛了，求解的是MP问题的一个lower bound。毕竟列生成是用于求解linear program的。如果要求解大规模整数规划问题，后面我们会介绍结合column generation的branch and price方法。

至此，我们已经完完整整把列生成算法给走了一遍。相信列生成算法的原理已经深入各位读者的心里啦。

05 列生成代码

获取方式

06 reference

干货 | 10分钟带你彻底了解column generation
OUTLINE 前言预备知识预警什么是column generation 相关概念科普 Cutting Sto...
线性规划技巧: 列生成(Column Generation)
列生成(Column Generation)是一种把线性规划问题分解为小规模子问题的技巧[1] [2]. 它的原理...
架构师带你彻底了解docker？
早在2013年的时候，docker就已经发行，然而那会还是很少人了解docker。一直到2014年，Martin ...
Conditional Generation by RNN &
Outline Generation Attention Tips for Generation Pointer ...
11.Conditional Generation by RNN
outline Generation Attention Tips for Generation Pointer ...
2018-02-24
The last generation The first generation We are the first...
【雷傲读书】游戏化思维
所有干货阅读都是耍流氓，流氓雷傲带你读书。今天带来的是《游戏化思维》。推荐阅读后有兴趣深入了解的同学购买阅读，并不...
02 异步通讯设计
一、了解[https://time.geekbang.org/column/article/3926] 隔离设计...
MVP的四级台阶
本篇带你快速了解MVP，然后用一个实践操作过程让我们彻底掌握MVP的使用。文章略长，欢迎收藏！上篇：你好MVP！...
了解MySQL6种约束的不同和特点
摘要：一篇文章带你彻底了解MySQL各种约束 MySQL约束 <1> 概念 · 是一种限制，它是对表的行和列的数据...

干货 | 10分钟带你彻底了解column generation

OUTLINE

00 前言

01 预备知识预警

Cutting Stock Problem[1]

建模

02 什么是column generation？

2.1 相关背景

2.2 larger linear programs

2.3 column generation

03 相关概念科普

3.1 master problem(MP)

3.2 linear master problem(LMP)

3.2 restricted linear master problem(RLMP)

3.3 subproblem

3.4 算法流程图

04 CG求解Cutting Stock Problem

4.1 restricted linear master problem(RLMP)

4.2 开始列生成过程

iteration 1

iteration 2

iteration 3

05 列生成代码

06 reference

相关文章

干货 | 10分钟带你彻底了解column generation

线性规划技巧: 列生成(Column Generation)

架构师带你彻底了解docker？

Conditional Generation by RNN &

11.Conditional Generation by RNN

2018-02-24

【雷傲读书】游戏化思维

02 异步通讯设计

MVP的四级台阶

了解MySQL6种约束的不同和特点

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读