美文网首页
Moment Matching矩匹配

Moment Matching矩匹配

作者: TonnyYan | 来源:发表于2018-09-22 14:07 被阅读215次

    几点注意:

    • 知道了dynamic以后,就可以进行规划,planning的方法有很多:
      简单随机搜索(一种简单、有效的规划算法),主要思想就是,在一段时域内对策略进行随机搜索(利用我们的dynamic进行模拟),然后用每组策略获得的cost分别评价每组策略,选取cost最低的那组策略作为我们的最优策略在实际的环境中运行。

    • MPC就是在LQR的基础上进行replan。LQR规划是十分依赖于精确模型的,当实际的环境与LQR规划所用的模型差距很大的时候,规划的效果将大打折扣,因此我们在每个时间步长进行replan,增加了LQR对模型的鲁棒性。

    • 高斯策略可以帮助更好的进行探索,让获得的数据看起来更加多样。

    • 如果能获得全局的模型global model,那就可以用它来作精确的预测(包括视频/图像的预测)

    • 用于收集数据的那个分布被称为是采样分布。

    • 时变的局部模型local model 其实很有用,很具有表达性,可以对接触、碰撞、非线性、非光滑动态进行精确建模。

    相关文章

      网友评论

          本文标题:Moment Matching矩匹配

          本文链接:https://www.haomeiwen.com/subject/ksxxoftx.html