美文网首页
文章点评CV10-Embed to Control: A Loc

文章点评CV10-Embed to Control: A Loc

作者: 闪电侠悟空 | 来源:发表于2019-12-20 15:48 被阅读0次

1.文章基本信息

  • 文章网址http://papers.nips.cc/paper/5964-embed-to-control-a-locally-linear-latent-dynamics-model-for-control-from-raw-images.pdf
  • NIPS, 2016, cited by 310+
  • 机器人重要的是Perception和Control,本文利用hidden space同时进行Perception的表达和control的表达,将这两个问题集成起来处理。也就是表示学习,使得学习的特征适合做control。这是本文最大的贡献吧。
  • 问题:这个文章一看就不是搞robot的人做的,都是机器学习的这一套。问题1,观测x是隐状态z的全面描述,这个假设太强。问题2,实验太toy了,并且没有和传统的perception+control套路进行对比,一比较的话应该没有优势。

2. 方法

论文方法图
  • 假设:For simplicity, we will in the following assume that x_t is a fully observed depiction of s_t( system state). 我认为,这是一个过于强的假设,在实际应用中存在很大的挑战。
  • 在t和t+1时刻,分别用VAE抽取stochastic的特征;
  • 将t时刻的特征z_t, 前向预测一波。利用局部线性的约束,预测的均值和方差都可近似表达,是文章的一个创新点。
  • 约束预测和观测量之间的距离,尽量 接近。
  • 没有像传统Kalman一样,结合预测和观测,得到更加精确的推断。

3. 实验

隐空间流形
  • 左边是真正的隐空间,右边是学习方法得到的隐空间,可以发现作者提出的E2C在这个案例中,比VAE要好很多。

  • 其他四个实验都很简单,主要是前提很简单,图像只有80*80大小,纯仿真。表明E2C在倒立摆实验,cart-pole实验,都能取得成功。

4. 遗留的问题

控制算法MPC(model predictive control)作者提到了两个具体的算法,由于以前没接触控制,不是很懂:

看完喜欢,记得点赞!有问题,也欢迎提出讨论。

相关文章

网友评论

      本文标题:文章点评CV10-Embed to Control: A Loc

      本文链接:https://www.haomeiwen.com/subject/tbhinctx.html