强化学习初探分类

作者: 永远学习中 | 来源:发表于2018-12-31 10:45 被阅读0次

分类
model-Free RL：不用理解环境
从环境中得到反馈进行学习
Policy Gradients
Sarsa
Q Learning
Model-Based RL：理解环境
需要为现实世界进行建模之后学习
Policy Gradients
Sarsa
Q Learning

基于概率（Policy-Based RL）
Policy Gradients
基于价值（value Based RL）
Sarsa
Q Learning
Actor-Critic
基于概率做出动作，给动作给分。

回合更新（Monte-Carlo update）
基础版本Policy Gradients
Monte-Carlo Learning
单步更新（Tenporal-Difference Update）
Sarsa
Q Learning
升级版本Policy Gradients

在线学习（On-Policy）
Sarsa
Sarsa（λ）
离线学习（Off-Policy）
Q Learning
Deep Q Learning

Q Learning

构建Q表

网友评论

本文标题：强化学习初探分类

本文链接：https://www.haomeiwen.com/subject/mvbhlqtx.html

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！