《强化学习》专题

专题列表页

AI人工智能学习笔记中的强化学习部分

好多文章被锁请访问我的博客
0
2020-10-15

还是自己搭的博客靠谱，简书把我的几乎所有的文章都锁定了。申诉根本没用！将大部分文章都整理到了自己博客，我也将会在那...[作者空间]

Tensorflow2.x 深度强化学习——Policy Gra
0
2020-04-29

在之前的文章中我们系统地介绍了强化学习，以及与神经网络相结合的深度强化学习。期间由于 Tensorflow 2.0...[作者空间]

强化学习：自动驾驶——Carla 模拟器简介
0
2019-09-15

自动驾驶是机器学习的一个重要的应用领域，作为普通学习者，我们是否可以运用自己学到的机器学习方法训练自动驾驶模型，完...[作者空间]

深度强化学习——Policy Gradient 玩转 CartP
5
2019-08-21

Image from unsplash.com by helloquence 前面的文章我们介绍了 Q-learn...[作者空间]

用 Keras 搭建 Double DQN 模型
4
2019-08-12

上一篇文章介绍了 DQN 以及如何用 Keras 一步一步搭建 DQN 模型，这篇文章我们来介绍一下 DQN 的改...[作者空间]

Q-Learning—可操控动作大小的小车爬山游戏
1
2019-07-19

image from unsplash.com by Pietro De Grandi 上篇文章我们用强化学习的方...[作者空间]

强化学习——Q-Learning SARSA 玩CarPole经
5
2019-07-08

Image from unsplash.com by Ferdinand Stöhr 前文我们讲了如何用Q-lea...[作者空间]

强化学习—— SARSA 和 SARSA lambda 玩 Mo
2
2019-07-08

Image from unsplash.com by Jonatan Pie 上一篇文章我们介绍了用 Q-lear...[作者空间]

强化学习—— Q-Learning 玩 MountainCar
25
2019-07-06

之前的文章结合理论和实践熟悉了 Q-Learning 的经典算法，这篇文章我们基于 Open AI 的经典 Mou...[作者空间]

DQN——深度Q-Learning轻松上手
2
2019-05-24

之前的文章简单介绍了深度Q-learning的理论以及Q-learng的实战，这篇文章我们就来实践一下与深度学习相...[作者空间]

强化学习——MC(蒙特卡洛)玩21点扑克游戏
2
2019-04-26

通过理论和实战，我们知道，在已知的MDP环境下，可以用动态规划(DP)的方法来获得最佳策略，指导智能体(Agent...[作者空间]

强化学习——强化学习的算法分类
7
2019-02-28

上一篇文章回顾了强化学习的核心概念，这里继续通过Open AI 的Spinning Up 项目总结强化学习(RL)...[作者空间]

强化学习实战——OpenAI Spinning Up项目
12
2019-02-22

前面的文章介绍了太多强化学习的理论，今天我们就通过具体项目，理论结合实践深入理解和学习强化学习。 1. Spinn...[作者空间]

AI学习笔记——浅谈强化学习应用于游戏博弈
3
2019-02-14

DeepMind 最近又上了新闻，他们最新的AlphaStar在星际争霸的游戏中与人类顶级星际玩家打成了11比1，...[作者空间]

AI学习笔记——强化学习之探索-利用(Exploration-E
7
2019-01-18

在之前的一篇文章中讲到了多臂老虎机问题，这是强化学习中探索-利用困境的经典案例。这篇文章将更多从理论上来探讨如何解...[作者空间]

AI学习笔记——基于模型(Model Based)的强化学习
0
2019-01-11

之前发表的关于强化学习的文章，无论是基于策略的还是基于价值的还是两者均兼顾的强化学习方法都没有涉及到具体的模型。 ...[作者空间]

AI学习笔记——Actor-Critic强化学习
9
2019-01-05

1. 回顾强化学习方法我们介绍了基于价值(Value-Based)的强化学习和基于策略(Policy-Based...[作者空间]

AI学习笔记——基于策略的强化学习
5
2019-01-04

1. 基于价值的强化学习回顾前几篇文章都是在讲通过训练值函数的近似函数，然后通过比如Ɛ-greedy探索方法获得...[作者空间]

AI学习笔记——强化学习之值函数近似(Value Functio
12
2018-12-07

前面两篇文章介绍了如何使用近似函数，而不是“查表”的方法找到最优策略，但是遇到了一个问题，就是在使用非线性近似函数...[作者空间]

AI学习笔记——强化学习之值函数近似(Value Functio
6
2018-12-07

前文介绍了函数近似来预测V函数，但是还没涉及到行动和控制，这篇文章就来谈谈用近似Q函数来控制和行动。 1. 控制—...[作者空间]

栏目导航

延伸阅读

栏目导航

爱情美文推荐

热点爱情美文

最新爱情美文