几点注意:
-
知道了
dynamic
以后,就可以进行规划,planning的方法有很多:
简单随机搜索(一种简单、有效的规划算法),主要思想就是,在一段时域内对策略进行随机搜索(利用我们的dynamic
进行模拟),然后用每组策略获得的cost
分别评价每组策略,选取cost
最低的那组策略作为我们的最优策略在实际的环境中运行。 -
MPC就是在LQR的基础上进行
replan
。LQR规划是十分依赖于精确模型的,当实际的环境与LQR规划所用的模型差距很大的时候,规划的效果将大打折扣,因此我们在每个时间步长进行replan
,增加了LQR对模型的鲁棒性。 -
高斯策略可以帮助更好的进行探索,让获得的数据看起来更加多样。
-
如果能获得全局的模型
global model
,那就可以用它来作精确的预测(包括视频/图像的预测) -
用于收集数据的那个分布被称为是采样分布。
-
时变的局部模型
local model
其实很有用,很具有表达性,可以对接触、碰撞、非线性、非光滑动态进行精确建模。
网友评论