Proximal Policy Optimization Alg

Proximal Policy Optimization Alg

作者: 初七123 | 来源:发表于2018-07-10 09:54 被阅读240次

Proximal Policy Optimization Alg
深度强化学习从入门到大师：以刺猬索尼克游戏为例讲解PPO（第六部
Proximal Policy Optimization(PPO
VPG && TRPO && PPO
聊天机器人-DPL模块
【ICLR 2018】模型集成的TRPO算法【附代码】
Trust Region Policy Optimization
Proximal Algorithms 4 Algorithms
浅谈策略梯度（PG）算法
Proximal Algorithms 3 Interpreta

Introduction

目前深度强化学习主要有deep Q-learning、policy gradient methods、trust region / natural policy gradient methods
PPO算法是TRPO的近似解，更容易实现

Background: Policy Optimization

Policy Gradient Methods

A_t是动作优势值
这种方法经常出现具有破坏性的梯度更新，见6.1节

Trust Region Methods
TRPO的关键作用在于找到合适的步长。合适的步长是指当策略更新后，回报函数的值不能更差。

用损失函数代替条件约束

但是这个系数b对于每个问题都是不一样的

Clipped Surrogate Objective

我们提出的目标函数如下

Adaptive KL Penalty Coeﬃcient

自适应散度惩罚系数
我们在实验中发现这种方法比前者要差一些

Algorithm

策略网络和值网络共享参数，得到目标函数

Experiments

比较目标函数

比较其它连续值算法

Atari

相关文章

Proximal Policy Optimization Alg
Introduction 目前深度强化学习主要有deep Q-learning、policy gradient m...
深度强化学习从入门到大师：以刺猬索尼克游戏为例讲解PPO（第六部
本文为 AI 研习社编译的技术博客，原标题： Proximal Policy Optimization (PPO...
Proximal Policy Optimization(PPO
这两天看了一下李宏毅老师的强化学习课程的前两讲，主要介绍了Policy Gradient算法和Proximal P...
VPG && TRPO && PPO
PPO（Proximal Policy Optimization）是一种解决 PG 算法中学习率不好确定的问题的...
聊天机器人-DPL模块
有一些资料把这部分称为Policy Optimization/Policy Learning。 1. 什么是DPL...
【ICLR 2018】模型集成的TRPO算法【附代码】
论文题目：model-ensemble trust-region policy optimization 所解决的...
Trust Region Policy Optimization
本文是自己的TRPO算法学习笔记，在数学原理推导核心部分附有自己的理解与解释。整篇文章逻辑清晰，思路顺畅。有想...
Proximal Algorithms 4 Algorithms
Proximal Algorithms 这一节介绍了一些利用proximal的算法. Proximal minim...
浅谈策略梯度（PG）算法
背景 Policy Optimization（策略优化）是强化学习中的一大类算法，其基本思路区别于Value-ba...
Proximal Algorithms 3 Interpreta
Proximal Algorithms 这一节，作者总结了一些关于proximal的一些直观解释 Moreau-Y...

网友评论

本文标题：Proximal Policy Optimization Alg

本文链接：https://www.haomeiwen.com/subject/kapxpftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Proximal Policy Optimization Alg|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！