美文网首页
2019-04-22派森学习第154天

2019-04-22派森学习第154天

作者: 每日派森 | 来源:发表于2019-04-22 21:44 被阅读0次

在迷宫宝藏的强化学习程序中,最主要的程序是RL_brain这个程序。

这个程序中,定义了一个QLearningTable的类,在类中定义了包括def __init__()在内的4个函数。

在def __init__()中线初始化定义了一些参数,比如学习效率

函数def choose_action()则设置了一个阈值epsilon,如果随机数小于阈值,则按照Q-table选择下一步,如果大于阈值,则随机选择下一步。

函数learn()中,考虑了两种情况:第一种,如果下一步不是终结,那么将按照红色的公式计算q_target;第二种,下一步是终结,则按照蓝色框计算q_target。最后还要根据q_target和q_predict的差值来更新Q值表。

learn

函数def check_state_exist()主要为了判断q状态表中的状态是不是存在。如果没有就创建。

相关文章

  • 2019-04-22派森学习第154天

    在迷宫宝藏的强化学习程序中,最主要的程序是RL_brain这个程序。 这个程序中,定义了一个QLearningTa...

  • 2019-06-20派森学习第187天

    通过restlet插件将参数post进web,然后程序执行成功:

  • 2019-06-21派森学习第188天

    修改的程序又出现了一个小BUG: 通过print测试,发现问题是index2workpackage_id函数处理问...

  • 2019-03-06派森学习第108天

    今天想把插入排序做出来。 插入排序(Insertion-Sort)的算法描述是一种简单直观的排序算法。它的工作原理...

  • 2019-03-07派森学习第109天

    早上来的路上又理了一下思路, 然后, 不到5分钟就写出来昨天的插值算法, 可能是昨天也急着写好, 所以导致反而写不出来。

  • 2019-03-05派森学习第107天

    毕竟以后要学习机器学习,少不了算法。 今天就自己开始写一些经典的算法吧,把经典的算法用python写一下。 从冒泡...

  • 2019-02-28派森学习第102天

    昨天把txt生成excell程序解决后,解放了很多劳动力啊。今天发起文章就容易多了。 科技解放人类。 接下来,需要...

  • 2019-03-09派森学习第111天

    今天先把机器学习的入门的贝叶斯公式重新回顾,总结了一下:

  • 2019-03-08派森学习第110天

    今天继续观看强化学习的视频,并且把源程序自己下载下来,并且做了修改。 强化学习迷宫的游戏,让机器自己学会找到黄色目...

  • 2019-03-10派森学习第112天

    通过昨天回顾的贝叶斯,今天学习如何通过它构建简单但功能强大的贝叶斯分类器。 代码如下:

网友评论

      本文标题:2019-04-22派森学习第154天

      本文链接:https://www.haomeiwen.com/subject/fafpgqtx.html