Gym 的 Frozen Lake 环境介绍

作者: 不会停的蜗牛 | 来源:发表于2020-03-06 23:52 被阅读0次

    Frozen Lake 是指在一块冰面上有四种state:

    S: initial stat 起点

    F: frozen lake 冰湖

    H: hole 窟窿

    G: the goal 目的地

    agent 要学会从起点走到目的地,并且不要掉进窟窿。

    上一篇文章有介绍gym里面env的基本用法,下面几行可以打印出一个当前环境的可视化:

    import gym # loading the Gym library
    env = gym.make("FrozenLake-v0")
    env.reset()                   
    env.render()

    如果想看这个游戏里面有多少state和action可以用下面两行,就上面图例而言,state 有0-15共16个,action有4个:

    print("Action space: ", env.action_space)
    print("Observation space: ", env.observation_space)

    在不采用任何算法时,env 可以通过 sample()  方法在每个state上随机选择 action。

    将选择的 action 输入给 env.step,同样可以得到 new_state, reward, done, info 这四个返回值。

    每次使用 env.render() 都能将当前新的环境布局展示出来。

    MAX_ITERATIONS = 10
    for i in range(MAX_ITERATIONS):
        random_action = env.action_space.sample()
        new_state, reward, done, info = env.step(
          random_action)
        env.render()
        if done:
            break

    学习资料:

    https://www.google.com/amp/s/reinforcementlearning4.fun/2019/06/16/gym-tutorial-frozen-lake/amp/

    相关文章

      网友评论

        本文标题:Gym 的 Frozen Lake 环境介绍

        本文链接:https://www.haomeiwen.com/subject/akvzrhtx.html