美文网首页强化学习
双轮机器人通过spinningup在mujoco中的测试记录

双轮机器人通过spinningup在mujoco中的测试记录

作者: 东流十月 | 来源:发表于2019-07-15 09:52 被阅读0次

    spinningup安装

    Spinningup-----openmpi  ----(mingw)gcc,g++编译器

    安装过程常遇问题既解决方法https://www.jianshu.com/p/2a6b606d9ae4

    常用命令行

    仿真spinngup

    python -m spinup.run ddpg --env vsbr2dir-v0

    --exp_name try1

    python -m spinup.run plot D:\anaconda3\envs\spinningup\data\vsbr2dir1\vsbr2dir1_s0

    视频

    python -m spinup.run test_policy D:\anaconda3\envs\spinningup\data\vsbr2dir\vsbr2dir_s0

    #查看空间属性

    print(env.action_space)

    #> Discrete(2)

    print(env.observation_space)

    #> Box(4,)

    #显示状态/动作空间范围

    print(env.observation_space.high)

    print(env.observation_space.low)

    相关图

    常遇报错

    returned non-zero exitstatus 1.

    多半是自己命令行代码命令敲错了,仔细检查

    测试结果记录

    1、DDPG方法

    (1)7.4.3,这个平衡效果可以,每回合基本都是同一个方向和位置,速度也适中挺慢的, steps_per_epoch=1000,epochs=50

    环境配置图

    (2)

    7.4.4 steps_per_epoch=5000,epochs=200,能平衡一定时间,速度很慢,效果可以

    总是以左轮加速而倒.17回合之后,倒地就不会立刻重新开始,done的条件不对

    python -m spinup.run test_policy

    D:\anaconda3\envs\spinningup\data\test.7.4.4\test.7.4.4_s0

    配置图

    (3)Test7.5.1其他限制条件同2,运行距离极短,效果不好

    配置图

    PPO方法

    (1)Test7.5.2,ppo算法,相对来说,也可以。没那么好,但算法运行快

    配置

    (2)Test7.5.3 距离极短(相当于原地),效果不好

    配置

    (3)Test 7.5.4,倒地不起的运动,说明此限制条件有误

    配置

    TRPO方法

    (1)Trpo  Test7.8.1,原地,时间极短,效果不佳

    配置

    SAC方法

    算法相关介绍:http://m.elecfans.com/article/834892.html

    (1)test7.8.2,平衡效果极佳,距离很长,segway下

    (2)Test7.8.3 基本静止,运动幅度很小,完美!

    python -m spinup.run test_policy d:\anaconda3\envs\spinningup\data\test7.8.3\test7.8.3_s0

    配置

    TD3方法

    (1)Test7.9.1效果一般,每次都超出边界

    配置

    持续更新,目前看,sac方法完美契合此机器人,持续改进。

    相关文章

      网友评论

        本文标题:双轮机器人通过spinningup在mujoco中的测试记录

        本文链接:https://www.haomeiwen.com/subject/uzxyjqtx.html