《强化学习》专题

专题列表页

上一篇文章介绍了强化学习中的Q-Learning算法，这篇文章介绍一个与Q-Learning十分类似的算法——Sa...[作者空间]

强化学习元素：actor(我们可以控制，决策我们的行为)，Env，Reward（我们不能控制环境）主要方法：mo...[作者空间]

在之前的几篇文章中，我们介绍了基于价值Value的强化学习算法Deep Q Network。有关DQN算法以及各种...[作者空间]

1、Q-learning回顾 Q-learning 的算法过程如下图所示：在Q-learning中，我们维护一...[作者空间]

摘要：入门一件新事物总是会有些无从下手的，看了本文希望可以给大家一些帮助和了解。机器学习算法，特别是神经网络被认...[作者空间]

Preface 本人最近在做强化学习的内容，我发现强化学习基础当中马尔科夫决策过程（MDP）的求解（策略迭代，值迭...[作者空间]

介绍目前，对于全球的科学家而言，“如何去学习一种新技能”已经成为最基本的研究课题之一。解决这个问题的意愿显而易见...[作者空间]

虽然是周末，也保持充电，今天来看看强化学习，不过不是要用它来玩游戏，而是觉得它在制造业，库存，电商，广告，推荐，金...[作者空间]

这篇论文是飞飞出品，你知道的，imageNet的光环。论文主要是通过深度增强学习让机器人在房间里面找东西。那么对...[作者空间]

增强学习（一） ----- 基本概念机器学习算法大致可以分为三种： 1. 监督学习(如回归，分类) 2. 非监督...[作者空间]