03-06 Q-Learning

03-06 Q-Learning

作者: woodwood2000 | 来源:发表于2017-12-21 15:10 被阅读0次

03-06 Q-Learning
ML4T笔记 | 03-06 Q-Learning
实战深度强化学习DQN-理论和实践
RL[0] - 初见
莫烦强化学习笔记2- Q Learning
RL
强化学习之Sarsa
RL: cliffwalk.py
白话强化学习之Sarsa与Sarsa-lambda
ML4T笔记 | 03-07 Dyna

https://classroom.udacity.com/courses/ud501/lessons/5247432317/concepts/53299733920923

image.png

Q-Learning: model free, 不会用到Transitons T 和 Rewards R，而是用到 Q 函数
Q 函数可以是一个 Table
Q 函数并不是 Greedy 的函数
运行完成后，Pi 策略和 Q 都会得到最优的解

image.png

image.png

image.png

Q'[s,a] 的结果是一个值？reward的现值+折现值？对的。看第一张 PPT

image.png

image.png

image.png

image.png

那种 reward 更快收敛？

image.png

image.png

找出好的 State
仅仅是 SMA（simple moving average）并不是好的状态，adjusted close 也不是。但组合起来就是了。

image.png

要将状态离散化

image.png

根据位置决定离散化的分界点 threshold

image.png

actions: Buy, Sell, Do nothing

image.png

image.png

Resources

CS7641 Machine Learning, taught by Charles Isbell and Michael Littman
- Watch for free on Udacity(mini-course 3, lessons RL 1 - 4)
- Watch for free on YouTube
- Or take the course as part of the OMSCS program!
RL course by David Silver(videos, slides)
A Painless Q-Learning Tutorial

相关文章

03-06 Q-Learning
https://classroom.udacity.com/courses/ud501/lessons/52474...
ML4T笔记 | 03-06 Q-Learning
01 - Overview Q-learning is a model-free approach. The tr...
实战深度强化学习DQN-理论和实践
1、Q-learning回顾 Q-learning 的算法过程如下图所示：在Q-learning中，我们维护一...
RL[0] - 初见
结构背景 Q-Learning with table Q-Learning with network 后记背景...
莫烦强化学习笔记2- Q Learning
Q-learning 决策: 根据Q表，选择reward较大的action. Q-learning 更新: 代码如下
RL
Q-learning Sarsa Sara-lambda
强化学习之Sarsa
在强化学习中，Sarsa和Q-Learning很类似，本次内容将会基于之前所讲的Q-Learning的内容。目录...
RL: cliffwalk.py
Keywords: Q-learning(radical)、Sarsa(conservative)、egreedy...
白话强化学习之Sarsa与Sarsa-lambda
Sarsa Sarsa的学习过程和Q-Learning基本一样，不同的地方是Q-Learning在走下一步的时候是...
ML4T笔记 | 03-07 Dyna
1 - Overview Q-learning is expensive because it takes man...

网友评论

本文标题：03-06 Q-Learning

本文链接：https://www.haomeiwen.com/subject/gcuowxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|03-06 Q-Learning|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！