使用Q-learning算法让Chrome小恐龙自动学习躲避障碍

作者: 关爱单身狗成长协会 | 来源:发表于2017-12-31 23:48 被阅读187次

使用Q-learning算法让Chrome小恐龙自动学习躲避障碍
Try to Fun
Chrome 小恐龙背后的故事 | 设计师专访
3.2 强化学习
实战深度强化学习DQN-理论和实践
AI学习笔记——Sarsa算法
chrome dino 外挂
用一个小游戏入门深度强化学习
2019-04-18派森学习第150天
基于Policy的强化学习算法

原理很简单,就是给定小恐龙障碍物类型、障碍物距离、游戏的相对速度作为状态,小恐龙有跳跃,低头,不做任何动作这三种动作可选,小恐龙存活则奖励碰到障碍物则惩罚。
Q-learning算法详细说明可参考知乎问题:如何用简单例子讲解 Q - learning 的具体过程？
在示例中我默认让小恐龙不做任何动作让其慢慢纠正错误,不然你们会看到:

不停乱跳或是低头有点鬼畜

按空格开始游戏

未学习示例:http://runjs.cn/detail/cirqzzgn
已学习部分(未学习躲避翼龙)记录示例:http://runjs.cn/detail/baxttgdk

使用Q-learning算法让Chrome小恐龙自动学习躲避障碍
原理很简单,就是给定小恐龙障碍物类型、障碍物距离、游戏的相对速度作为状态,小恐龙有跳跃,低头,不做任何动作这三种动...
Try to Fun
AI自动玩游戏 CharlesPikachu/AIGames Chrome小恐龙自动奔跑 Chrome 小恐龙自动...
Chrome 小恐龙背后的故事 | 设计师专访
简评： Chrome 有个小彩蛋每当断网的时候，可以玩小恐龙游戏（Chrome dino）。小恐龙象征着「远古无 ...
3.2 强化学习
如今用于：自动驾驶汽车机器人吸尘器游戏自动交易企业资源管理流行算法： Q-Learning SARSA...
实战深度强化学习DQN-理论和实践
1、Q-learning回顾 Q-learning 的算法过程如下图所示：在Q-learning中，我们维护一...
AI学习笔记——Sarsa算法
上一篇文章介绍了强化学习中的Q-Learning算法，这篇文章介绍一个与Q-Learning十分类似的算法——Sa...
chrome dino 外挂
Chrome浏览器在没有联网的时候，可以玩一个恐龙跳障碍的小游戏，可能很多人都玩过（地址：chrome://din...
用一个小游戏入门深度强化学习
今天我们来用深度强化学习算法 deep Q-learning 玩 CartPole 游戏。强化学习是机器学习的一...
2019-04-18派森学习第150天
想要用强化学习改进派工算法。强化学习在之前学习过一个Q-learning算法。强化学习的基本写法和神经网络很相...
基于Policy的强化学习算法
在文章基于Value的强化学习算法中，介绍了Q-learning和SARSA两种经典的强化学习算法。在本篇文章中，...