2019-04-22派森学习第154天

作者: 每日派森 | 来源:发表于2019-04-22 21:44 被阅读0次

2019-04-22派森学习第154天
2019-06-20派森学习第187天
2019-06-21派森学习第188天
2019-03-06派森学习第108天
2019-03-07派森学习第109天
2019-03-05派森学习第107天
2019-02-28派森学习第102天
2019-03-09派森学习第111天
2019-03-08派森学习第110天
2019-03-10派森学习第112天

在迷宫宝藏的强化学习程序中，最主要的程序是RL_brain这个程序。

这个程序中，定义了一个QLearningTable的类，在类中定义了包括def __init__()在内的4个函数。

在def __init__()中线初始化定义了一些参数，比如学习效率

函数def choose_action()则设置了一个阈值epsilon,如果随机数小于阈值，则按照Q-table选择下一步，如果大于阈值，则随机选择下一步。

函数learn()中，考虑了两种情况：第一种，如果下一步不是终结，那么将按照红色的公式计算q_target；第二种，下一步是终结，则按照蓝色框计算q_target。最后还要根据q_target和q_predict的差值来更新Q值表。

learn

函数def check_state_exist()主要为了判断q状态表中的状态是不是存在。如果没有就创建。

2019-04-22派森学习第154天
在迷宫宝藏的强化学习程序中，最主要的程序是RL_brain这个程序。这个程序中，定义了一个QLearningTa...
2019-06-20派森学习第187天
通过restlet插件将参数post进web，然后程序执行成功：
2019-06-21派森学习第188天
修改的程序又出现了一个小BUG：通过print测试，发现问题是index2workpackage_id函数处理问...
2019-03-06派森学习第108天
今天想把插入排序做出来。插入排序（Insertion-Sort）的算法描述是一种简单直观的排序算法。它的工作原理...
2019-03-07派森学习第109天
早上来的路上又理了一下思路，然后，不到5分钟就写出来昨天的插值算法，可能是昨天也急着写好，所以导致反而写不出来。
2019-03-05派森学习第107天
毕竟以后要学习机器学习，少不了算法。今天就自己开始写一些经典的算法吧，把经典的算法用python写一下。从冒泡...
2019-02-28派森学习第102天
昨天把txt生成excell程序解决后，解放了很多劳动力啊。今天发起文章就容易多了。科技解放人类。接下来，需要...
2019-03-09派森学习第111天
今天先把机器学习的入门的贝叶斯公式重新回顾，总结了一下：
2019-03-08派森学习第110天
今天继续观看强化学习的视频，并且把源程序自己下载下来，并且做了修改。强化学习迷宫的游戏，让机器自己学会找到黄色目...
2019-03-10派森学习第112天
通过昨天回顾的贝叶斯，今天学习如何通过它构建简单但功能强大的贝叶斯分类器。代码如下：

网友评论

本文标题：2019-04-22派森学习第154天

本文链接：https://www.haomeiwen.com/subject/fafpgqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

2019-04-22派森学习第154天

相关文章