MPC之持续扰动下带约束的预测控制（L. Chisci 2001

作者: AntiGravity | 来源:发表于2023-01-09 19:53 被阅读0次

MPC之持续扰动下带约束的预测控制（L. Chisci 2001
无人驾驶——模型预测算法MPC
2018-03-29
2018-12-01Model Predictive Contr
计算随机误差
MPC VM
iOS开发之AutoLayout-基础控件
14-MPC已死，有事烧纸！
40%的40岁男人就有，80%的80岁男人受它的折磨
动态修改约束没效果？也许是因为动作太快了！

原文标题：Systems with persistent disturbances: predictive control with restricted constraints

摘要

本论文解决在此场景下的LDTS（线性离散时间系统）的predictive state control：持续有界扰动、控制约束。
通常情况：约束和扰动会使得控制器不可行、不稳定。
结果通过仿真图像展示。

1. 介绍

predictive control law: 最小化moving horizon performance index（考虑控制量、状态约束）
没有扰动的控制已被充分讨论：(Keerthi & Gilbert, 1988)
如何保证稳定：ensure feasibility, 即admissible input sequence（满足约束和terminal conditions），但nominal cost constrained minimization for future state vectors在扰动下无法实现
旧方法：min-max最优化（Lee and Yu 1997，Scokaert and Mayne 1998），但是两大缺点：计算成本高；在最坏情况下的扰动下表现糟糕。
正确的考量：在所有可能的扰动下，最小化nominal performance index。例如，给予合适的约束（Casavola and Mosca，1996；Gossner et al.，1997）。
本文基于Gossner的结果做了很大改进，提出了robust predictive controller。1. 使用了状态-空间框架，因此可用于多变量系统，原只考虑SISO系统。2. 适用于任何stablizing terminal control law，原只用于dead-beat terminal conditions。3. 不仅在有界状态响应和无扰动下保证了渐进稳定，还保证在终端线性反馈和扰动下，状态收敛于最小可行鲁棒不变集（the set of all states reachable from the origin under the disturbance input and the terminal linear constant feedback）。

2. 问题成型

2.1 集合的相关定义

$\mathscr{A+B}$ ：所有元素的组合的和
$\mathscr{A-B}$ ：同上，作差
$M\mathscr{(A)}$ : 对 $\mathscr{A}$ 所有元素用M映射
$M^{-1}\mathscr{(C)}$ : 所有使Ma= $\mathscr{C}$ 的a
$\mathscr{A\sim B}$ : 所有使a+ $\mathscr{B}$ 包含于 $\mathscr{A}$ 的a
$int\mathscr{(A)}$ ：A内部

2.2 系统定义

凡满足（2）的扰动称为admissible
$\mathscr{(A,B)}$ 可稳定
$\mathscr{U,X,W}$ 都包含原点
$\mathscr{U,W}$ 都是compact set（闭集合且无聚点）

2.3 控制目标

设计一个非线性的状态反馈—— $u_t=g(x_t)$ ，能使系统到达原点的邻域Ω（尽量小），并在满足所有约束和条件下reduce to a linear well-tuned feedback。

nominal feedback: $u_t=Fx_t$ ，无约束下的最优控制，假设已知并固定。因此渐进稳定的nominal闭环系统是：

$\Phi$ 的所有特征值在单位圆内。

Definition 1: $\Sigma \subset \mathbb{R^n}$ ，若对所有x和w，都有 $Ax+Dw$ 也在 $\Sigma$ 内，则称为d-invariant，扰动不变集。

$\mathscr{X}_c\triangleq \mathscr{X}\cap F^{-1}\mathscr{(U)}$ ：在nominal feedback下满足约束的状态。
重新定义Ω：闭环系统的 $\mathscr{X}_c$ 的最小d-invariant。
$\mathscr{R}_j\triangleq \sum_{i=0}^{j-1}\Phi^iD\mathscr{W}$ : 标称线性闭环系统的j步可达集（从原点出发，有扰动w）。1. $j\rightarrow \infty$ 时极限存在，且 $\mathscr{R}_\infty$ 为最小compact d-invariant set, 即 $\subset \Sigma$ 。即， $\mathscr{R}_\infty \subset \mathscr{X}_c \iff \mathscr{X}_c$ 有d-invariant。

2.4 重申控制目标

新目标：使非线性反馈渐进趋于nominal feedback，即：

3. Robust predictive control via 约束限制

NPC Nominal Predictive Control：无扰动下的控制
RPC Robust Predictive Control：考虑扰动
$c_{t+k|t}$ : 在t时刻根据nominal feedback计划的未来动作
$x_{t+k|t},u_{t+k|t}$ : 根据 $x_t, c_{t+j|t}$ 得到的不考虑扰动的对 $x_{t+k},u_{t+k}$ 的预估， $0\leq j<k$

3.1 NPC

根据t时刻的状态 $x_t$ ：

损失函数： $\min J\triangleq \sum_{k=0}^{N-1} c^T_{t+k|t}\Psi c_{t+k|t}$
约束
求最优解： $\hat{C}_t\triangleq [\hat{c}^T_{t|t},\hat{c}^T_{t+1|t},\dots,\hat{c}^T_{t+N-1|t}]^T$
$c_t=\hat{c}_{t|t}$ ，代入 $u_t=Fx_t+c_t$

Remark 2: N为控制时域，代表总共考虑几步。N越大表现越好，可行域越大但计算成本越高。
Remark 3：J代表和nomianl control的偏差。若F是无约束的LQ反馈增益并要获得最小的u和x的二次损失，则 $\Psi=R+B^TPB$ ，P来自Riccati方程，此时u和x的二次损失变为知名的LQ方程：

Remark 4：

c_t\triangleq \hat{c}_{t|t}=c({x_t})

，最优控制序列的第一项依赖

x_t

，用以定义

g(x_t)=Fx_t+c(x_t)

Remark 5: 每个x和u都需要在k>0时满足约束，但无穷多的约束可化简为有限个（

N+i^*

）。

3.2 RPC

考虑扰动，真实的x和u如下：
$x_{t+k}=x_{t+k|t}+\sum^k_{i=1} \Phi^{i-1}Dw_{t+k-i}$
$u_{t+k}=u_{t+k|t}+\sum^k_{i=1}F \Phi^{i-1}Dw_{t+k-i}$
都由无扰动预测和扰动下的强制响应两项组成。因此，NPC中的（18）约束改写为更严格的：
$x_{t+k|t}\in \mathscr{X}_k,\; u_{t+k|t}\in \mathscr{U}_k, \; k\geq 0$ , 其中:
$\mathscr{X}_k\triangleq \mathscr{X}\sim \mathscr{R}_k,\;\mathscr{U}_k\triangleq \mathscr{U}\sim F\mathscr{R}_k.\quad (21)$
将NPC的约束（18）改为如上即RPC算法，根据 $x_t$ 计算 $u_t$ 。

3.3 实现中的问题

为将无限多的约束（21）减少，实际上当 $k\geq N$ 时，等价于 $x_{t+N|t}\in \Sigma_0 \sim \mathscr{R}_N$ ，其中 $\Sigma_0\triangleq\{x:\Phi^ix\in \mathscr{X}, F\Phi^ix\in \mathscr{X} \text{ for }i = 0,1,\dots,i^*\}$ ，在XUW都是多面体时i*可由LP工具离线确定。因此，约束（21）可改写为：
$x_{t+k|t}\in \mathscr{X}_k,\; u_{t+k|t}\in \mathscr{U}_k, \; k=0,1,\dots,N-1$ ,
$x_{t+N|t}\in \Sigma_0 \sim \mathscr{R}_N\qquad (25)$
RPC问题也改写为：

其中，L M v是一些合适的矩阵，代表了约束（25）。这个RPC算法比原论文有两点不同：

采用状态x而不是输入-输出框架，从而可以考虑广义的状态约束如U W；
nominal feedback不需要是deadbeat，反而deadbeat可能缩小可行域。

4. 主要结果

Definition 6:
$C_t$ 对 $x_t$ admissible: 满足14-17、21约束
$x_t$ feasible：存在admissible的 $C_t$

4.1 Feasibility and stability

Lemma 7: 若 $\hat C$ 对 $x_t$ admissible $\Rightarrow \tilde C_{t+1}$ 对 $x_{t+1}$ 也 admissible
证略。
Theorem 8: 若 $x_0$ feasible, RPC反馈 $u_t=Fx_t+c_t, c_t=\hat c_{t|t}$ ，则1. x和u在所有时刻满足约束X U；2. $c_\infty=0$ ；3. $x_\infty\rightarrow\mathscr R_\infty$
证略。
借Theorem 8可知，只要初始态为可行域，则通过RPC反馈可保证最终态收敛于 $\mathscr R_\infty$ 。

4.2 吸引域（the domain of attraction）

$\underline\Sigma_N$ :
解释1：可行的初始域，取决于N，也是RPC反馈下的闭环系统的吸引域， $\in \mathscr X$ 。
解释2：在扰动下在N步内收敛入 $\Sigma_0$ .
若W X U都是凸多面体， $\Sigma_0, \underline\Sigma_N$ 都是凸多面体。且：
$\underline\Sigma_N=\{x|\exists c: M_Nc+L_Nx\leq v_n\}$

5. 比较

将RPC算法与已有的：1. NPC；2. deadbeat RPC；3. Command Governers 分别比较。对第3还进行融合测试。
测试例子中，给出A B D F矩阵，给出 $\mathscr{X, U, W}$ 的约束条件，给出Q,R，F是根据Q R得出的LQ增益，系统特征值都在单位圆外。

5.1 和NPC比较

定义：

$\overline\Sigma_N$ ：无扰动NPC下的吸引域
$\overline\Sigma_0$ ： $\mathscr X_c$ 的最大不变集（？
$\underline\Sigma_N\subset \overline\Sigma_N$ : 比较扰动的影响
结论：RPC在域内可以处理最坏情况的扰动，保持稳定。

5.2 与deadbeat RPC比较

本算法吸引域更大，或者说，同样的吸引域，算力成本更低。

5.3 与Command Governor (CG)的连接

CG 的论文（Casavola
&Mosca (1996); Gilbert&Kolmanovsky (1999)）
虽然CG原始的作用是定值跟踪(set point tracking)，但也可用于调整。
以下是重塑的CG算法：

N=0
将（16）的控制序列改为： $u_{t+k|t}=Fx_{t+k|t}+\gamma,\; k\geq 0$
损失函数： $J(\gamma)\triangleq \gamma^T\Psi_\gamma\gamma\triangleq||\gamma||^2_\Psi, \Psi_\gamma=\Psi_\gamma^T>0$

$\gamma$ ：满足约束的自由度，取代N。
$x(\gamma)=(I-\Phi)^{-1}B\gamma$ : 平衡状态
$u(\gamma)=[F(I-\Phi)^{-1}B+I]\gamma$ ：输入
$\Gamma\triangleq\{\gamma:\;x(\gamma)\in int(\mathscr X_\infty),u(\gamma)\in int(\mathscr U_\infty)\}$ ：set of statically admissible commands
$\Sigma_0(\gamma)\triangleq\{x:\Phi^k(x-x(\gamma))+x(\gamma)\in\mathscr X_k \text{ and } F\Phi^k(x-x(\gamma))+u(\gamma)\in\mathscr U_k,\forall k\geq 0\}$ ： $\mathscr X_c$ 的最大d-invariant。
CG算法可表示为：
$\gamma_t=\gamma(x_t)=\arg \min_{\gamma\in\Gamma} ||\gamma||^2_\Psi, \text{ subject to } x_t\in\Sigma_0(\gamma)$
$\Sigma_0(\Gamma)\triangleq\bigcup_{\gamma\in\Gamma}\Sigma_0(\gamma)$ : 对任何 $x_0\in\Sigma_0(\Gamma)$ , 有限时间后所有 $\gamma_t=0$ 。即相当于RPC的 $\underline\Sigma_N$ 。
对于CG算法，通过遍历 $\Gamma$ 的所有 $\gamma$ 来扩大 $\Sigma_0$ , 而RPC则通过N个自由控制步数来将 $\Sigma_0$ 来扩张到 $\underline\Sigma_N$ 。显然N步的提升性能更好
RPC也可用于定值追踪。 $\tilde x=x-x(\gamma), \tilde u=u-u(\gamma)$ ，反馈command是 $\gamma=u(\gamma)-Fx(\gamma)$ 。只要 $x_t\in\underline\Sigma_N(\gamma)$ ,即 $\Sigma_0(\gamma)$ 在N步自由控制后。
只要 $x(\gamma_1)+\mathscr R_\infty\subset\underline\Sigma_N(\gamma_2)$ ，即可从 $\gamma_1$ 转换到 $\gamma_2$ 。
可以将两者RPC和CG结合起来：
$u_{t+k|t}=Fx_{t+k|t}+c_{t+k|t}+\gamma, k\geq 0, c_{t+k|t}=0, k\geq N$

6. 总结

合适的约束限制可以使预测控制器更鲁棒。如果初始状态是可行的，则未来对于所有允许的扰动都是可行的。由于约束限制可以离线运算，可以避免在线的额外计算负担。

MPC之持续扰动下带约束的预测控制（L. Chisci 2001
原文标题：Systems with persistent disturbances: predictive con...
无人驾驶——模型预测算法MPC
Overall of the MPC 模型预测控制（Model Predictive Control）指一类算法，...
2018-03-29
mpc模型预测控制。 8小时的任务量，给你8小时，如何规划？大部分人是工作8小时，每小时完成1/8。如果是mpc...
2018-12-01Model Predictive Contr
模型预测控制的定义：MPC是一种基于模型的闭环优化控制主要思想：根据模型当前的状态和输入，以及所构建的系统模型来预...
计算随机误差
参考文献 Finkelstein, P. L. and P. F. Sims (2001). "Sampling ...
MPC VM
MPC VM致力支持通用的MPC 计算程序，开发者无需了解MPC即可构建MPC 应用。目前主要有SCALE-MA...
iOS开发之AutoLayout-基础控件
基础面板-1 排版位置面板约束控制面板01 约束控制面板02 约束控制面板03 编辑/修改约束面板
14-MPC已死，有事烧纸！
什么是MPC？ MPC，全称Most Placeable Candidate。其中Placeable是个臆造出来的...
40%的40岁男人就有，80%的80岁男人受它的折磨
MPC 前列腺配方— 最强劲的天然配方 MA公司的 MPC 为您提供了一条前列腺保健的自然的途径。MPC 让您将不...
动态修改约束没效果？也许是因为动作太快了！
修改/更新约束的值：一般情况下是可以直接将约束拖线到试图控制器类中进行修改constant的值进行更新约束的操作...

MPC之持续扰动下带约束的预测控制（L. Chisci 2001

摘要

1. 介绍

2. 问题成型

2.1 集合的相关定义

2.2 系统定义

2.3 控制目标

2.4 重申控制目标

3. Robust predictive control via 约束限制

3.1 NPC

3.2 RPC

3.3 实现中的问题

4. 主要结果

4.1 Feasibility and stability

4.2 吸引域（the domain of attraction）

5. 比较

5.1 和NPC比较

5.2 与deadbeat RPC比较

5.3 与Command Governor (CG)的连接

6. 总结

相关文章

MPC之持续扰动下带约束的预测控制（L. Chisci 2001

无人驾驶——模型预测算法MPC

2018-03-29

2018-12-01Model Predictive Contr

计算随机误差

MPC VM

iOS开发之AutoLayout-基础控件

14-MPC已死，有事烧纸！

40%的40岁男人就有，80%的80岁男人受它的折磨

动态修改约束没效果？也许是因为动作太快了！

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读