还是自己搭的博客靠谱,简书把我的几乎所有的文章都锁定了。申诉根本没用!将大部分文章都整理到了自己博客,我也将会在那...[作者空间]
在之前的文章中我们系统地介绍了强化学习,以及与神经网络相结合的深度强化学习。期间由于 Tensorflow 2.0...[作者空间]
自动驾驶是机器学习的一个重要的应用领域,作为普通学习者,我们是否可以运用自己学到的机器学习方法训练自动驾驶模型,完...[作者空间]
Image from unsplash.com by helloquence 前面的文章我们介绍了 Q-learn...[作者空间]
上一篇文章介绍了 DQN 以及如何用 Keras 一步一步搭建 DQN 模型,这篇文章我们来介绍一下 DQN 的改...[作者空间]
image from unsplash.com by Pietro De Grandi 上篇文章我们用强化学习的方...[作者空间]
Image from unsplash.com by Ferdinand Stöhr 前文我们讲了如何用Q-lea...[作者空间]
Image from unsplash.com by Jonatan Pie 上一篇文章我们介绍了用 Q-lear...[作者空间]
之前的文章结合理论和实践熟悉了 Q-Learning 的经典算法,这篇文章我们基于 Open AI 的经典 Mou...[作者空间]
之前的文章简单介绍了深度Q-learning的理论以及Q-learng的实战,这篇文章我们就来实践一下与深度学习相...[作者空间]
通过理论和实战,我们知道,在已知的MDP环境下,可以用动态规划(DP)的方法来获得最佳策略,指导智能体(Agent...[作者空间]
上一篇文章回顾了强化学习的核心概念,这里继续通过Open AI 的Spinning Up 项目总结强化学习(RL)...[作者空间]
前面的文章介绍了太多强化学习的理论,今天我们就通过具体项目,理论结合实践深入理解和学习强化学习。 1. Spinn...[作者空间]
DeepMind 最近又上了新闻,他们最新的AlphaStar在星际争霸的游戏中与人类顶级星际玩家打成了11比1,...[作者空间]
在之前的一篇文章中讲到了多臂老虎机问题,这是强化学习中探索-利用困境的经典案例。这篇文章将更多从理论上来探讨如何解...[作者空间]
之前发表的关于强化学习的文章,无论是基于策略的还是基于价值的还是两者均兼顾的强化学习方法都没有涉及到具体的模型。 ...[作者空间]
1. 回顾强化学习方法 我们介绍了基于价值(Value-Based)的强化学习和基于策略(Policy-Based...[作者空间]
1. 基于价值的强化学习回顾 前几篇文章都是在讲通过训练值函数的近似函数,然后通过比如Ɛ-greedy探索方法获得...[作者空间]
前面两篇文章介绍了如何使用近似函数,而不是“查表”的方法找到最优策略,但是遇到了一个问题,就是在使用非线性近似函数...[作者空间]
前文介绍了函数近似来预测V函数,但是还没涉及到行动和控制,这篇文章就来谈谈用近似Q函数来控制和行动。 1. 控制—...[作者空间]