策略梯度及 PPO 算法

策略梯度及 PPO 算法

作者: 58506fd3fbed | 来源:发表于2020-10-28 23:40 被阅读0次

5. 策略梯度（Policy Gradients）
强化学习基础篇（三十）策略梯度(二)MC策略梯度算法
强化学习基础篇（三十一）策略梯度(3)Actor-Critic算
详解策略梯度算法
深入浅出--梯度下降法及其实现
深度强化学习--TRPO与PPO实现
强化学习基础篇（三十二）基于模型的强化学习算法
深度强化学习Trick：动作标准化
Cousera——Machine Learning习题笔记
7.值函数方法（Value Function Methods）

1. on-policy(同策略)：要learn的agent和环境互动的agent是同一个时，对应的policy。

2. off-policy(异策略)：要learn的agent和环境互动的agent不是同一个时，对应的policy。

3. important sampling（重要性采样）：使用另外一种数据分布，来逼近所求分布的一种方法，在强化学习中通常和蒙特卡罗方法结合使用。

4. policy（策略）：每一个actor中会有对应的策略，这个策略决定了actor的行为。具体来说，Policy 就是给一个外界的输入，然后它会输出 actor 现在应该要执行的行为。

5. Return（回报）：一个回合（Episode）或者试验（Trial）所得到的所有的reward的总和，也被人们称为Total reward。

6. Reward function：根据在某一个 state 采取的某一个 action 决定说现在这个行为可以得到多少的分数，它是一个 function。

7. Reinforce：基于策略梯度的强化学习的经典算法，其采用回合更新的模式。

相关文章

5. 策略梯度（Policy Gradients）
5. 策略梯度（Policy Gradients）本文主要包含几个方面：策略梯度算法介绍。策略梯度如何工作。...
强化学习基础篇（三十）策略梯度(二)MC策略梯度算法
强化学习基础篇（三十）策略梯度(二)MC策略梯度算法 1、Score Function 假设策略是可微分的，并且在...
强化学习基础篇（三十一）策略梯度(3)Actor-Critic算
强化学习基础篇（三十一）策略梯度(3)Actor-Critic算法 1.引入Baseline 在使用策略梯度方法更...
详解策略梯度算法
本文首发于行者AI[https://link.zhihu.com/?target=https%3A//xingzh...
深入浅出--梯度下降法及其实现
梯度下降的场景假设梯度梯度下降算法的数学解释梯度下降算法的实例梯度下降算法的实现Further reading 本...
深度强化学习--TRPO与PPO实现
PPO是2017年由OpenAI提出的一种基于随机策略的DRL算法，它不仅有很好的性能（尤其是对于连续控制问题），...
强化学习基础篇（三十二）基于模型的强化学习算法
强化学习基础篇（三十二）基于模型的强化学习算法在策略梯度算法中，智能体是直接从经验中去学习策略。之前value-...
深度强化学习Trick：动作标准化
策略梯度Policy Gradient类的算法，如DDPG等，可以处理连续动作空间continuous actio...
Cousera——Machine Learning习题笔记
代价函数及梯度下降算法的应用 /#1 Consider the following training set of...
7.值函数方法（Value Function Methods）
1. 从Actor-Critc算法中抛开策略梯度首先回顾下之前的actor-critic算法，其中的优势函数体现...

网友评论

本文标题：策略梯度及 PPO 算法

本文链接：https://www.haomeiwen.com/subject/dyhrvktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|策略梯度及 PPO 算法|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！