今天继续观看强化学习的视频,并且把源程序自己下载下来,并且做了修改。
强化学习迷宫的游戏,让机器自己学会找到黄色目标。
刚开始运行是这样的:
![](https://img.haomeiwen.com/i9582013/f54559cadc91d299.gif)
经过一段时间的学习之后:
![](https://img.haomeiwen.com/i9582013/17c35954b2db6889.gif)
把observation_打印出来方便观察,
![](https://img.haomeiwen.com/i9582013/5b1bb6d445e2bbec.png)
其中用到的Q-Learning算法:
![](https://img.haomeiwen.com/i9582013/fe575a7942981b02.png)
今天继续观看强化学习的视频,并且把源程序自己下载下来,并且做了修改。
强化学习迷宫的游戏,让机器自己学会找到黄色目标。
刚开始运行是这样的:
经过一段时间的学习之后:
把observation_打印出来方便观察,
其中用到的Q-Learning算法:
本文标题:2019-03-08派森学习第110天
本文链接:https://www.haomeiwen.com/subject/xlfrpqtx.html
网友评论