Q-learning

Q-learning

作者: lojike | 来源:发表于2020-04-05 00:09 被阅读0次

实战深度强化学习DQN-理论和实践
RL[0] - 初见
莫烦强化学习笔记2- Q Learning
RL
强化学习之Sarsa
RL: cliffwalk.py
白话强化学习之Sarsa与Sarsa-lambda
ML4T笔记 | 03-07 Dyna
【5分钟 Paper】Deep Reinforcement Le
【5分钟 Paper】Deep Recurrent Q-Lear

q-learning的步骤：

1、初始化Q-table ， Q(s,a)可以设为0

2、定义初始状态state，s

3、根据策略π选择动作action，a

4、实施动作action，a

5、计算实施动作a所获得的reward

6、更新Q-table

Q函数：学习动作值函数，返回某状态下执行某动作的未来期奖励望值

使用Bellman方程来更新Q-table

最终得到的是一个可以使用的Q-table

因为初始值都为0，无法决策，可以引入探索机制

相关文章

实战深度强化学习DQN-理论和实践
1、Q-learning回顾 Q-learning 的算法过程如下图所示：在Q-learning中，我们维护一...
RL[0] - 初见
结构背景 Q-Learning with table Q-Learning with network 后记背景...
莫烦强化学习笔记2- Q Learning
Q-learning 决策: 根据Q表，选择reward较大的action. Q-learning 更新: 代码如下
RL
Q-learning Sarsa Sara-lambda
强化学习之Sarsa
在强化学习中，Sarsa和Q-Learning很类似，本次内容将会基于之前所讲的Q-Learning的内容。目录...
RL: cliffwalk.py
Keywords: Q-learning(radical)、Sarsa(conservative)、egreedy...
白话强化学习之Sarsa与Sarsa-lambda
Sarsa Sarsa的学习过程和Q-Learning基本一样，不同的地方是Q-Learning在走下一步的时候是...
ML4T笔记 | 03-07 Dyna
1 - Overview Q-learning is expensive because it takes man...
【5分钟 Paper】Deep Reinforcement Le
论文题目：Deep Reinforcement Learning with Double Q-learning 所...
【5分钟 Paper】Deep Recurrent Q-Lear
论文题目：Deep Recurrent Q-Learning for Partially Observable M...

网友评论

本文标题：Q-learning

本文链接：https://www.haomeiwen.com/subject/ibbephtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Q-learning|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！