美文网首页
使用Q-learning算法让Chrome小恐龙自动学习躲避障碍

使用Q-learning算法让Chrome小恐龙自动学习躲避障碍

作者: 关爱单身狗成长协会 | 来源:发表于2017-12-31 23:48 被阅读187次

    原理很简单,就是给定小恐龙障碍物类型障碍物距离游戏的相对速度作为状态,小恐龙有跳跃,低头,不做任何动作这三种动作可选,小恐龙存活则奖励碰到障碍物则惩罚
    Q-learning算法详细说明可参考知乎问题:如何用简单例子讲解 Q - learning 的具体过程?
    在示例中我默认让小恐龙不做任何动作让其慢慢纠正错误,不然你们会看到:




    不停乱跳或是低头有点鬼畜

    按空格开始游戏

    相关文章

      网友评论

          本文标题:使用Q-learning算法让Chrome小恐龙自动学习躲避障碍

          本文链接:https://www.haomeiwen.com/subject/zrrzgxtx.html