MARL 笔记

MARL 笔记

作者: AntiGravity | 来源:发表于2022-06-19 16:09 被阅读0次

MARL 笔记
558 A Visitor in Marl泥土里的访
Papers of Multi Agent Reinforcem
Marl&Kars
Marl&Kars
Marl&Kars
何哥说酒:在新西兰拥有一个酒庄多少钱？
开发笔记目录查看
目录
《大江大河》笔记若干（一）

16年的MARL概览: A comprehensive survey of multiagent reinforcement learning（谷歌学术）

Model-free时学习均衡：

Nash Q-learning：仅在强假设收敛，多个收敛点。（类似的有MADDPG、Mean-Field Q-learning）
Stackelberg 均衡：越合作越优于Nash均衡，且仅有一个收敛点，是帕累托最优点。

Model-based时学习均衡：

Minimax-Q method

协同（对其他agent建模）

PR2（Probabilistic Recursive Reasoning）

合作（MA共享同一个reward）

通讯 - Multiagent Bidirectionally-Coordinated Net
集中训练分布执行 - Multi-Agent Actor-Critic for Mixed Cooperative-Competitve Environments

相关文章

MARL 笔记
16年的MARL概览: A comprehensive survey of multiagent reinforc...
558 A Visitor in Marl泥土里的访
A Visitor in Marl Who influences Flowers Till they are or...
Papers of Multi Agent Reinforcem
Papers in Multi-Agent Reinforcement Learning(MARL) This i...
Marl&Kars
世人皆知，巴黎时尚界有一个奢侈品牌名为Marl&Kars，各年龄阶层的男男女女都为它着迷。却少有人知晓，它的来历…...
Marl&Kars
世人皆知，巴黎时尚界有一个奢侈品牌名为Marl&Kars，各年龄阶层的男男女女都为它着迷。却少有人知晓，它的来历…...
Marl&Kars
世人皆知，巴黎时尚界有一个奢侈品牌名为Marl&Kars，各年龄阶层的男男女女都为它着迷。却少有人知晓，它的来历…...
何哥说酒:在新西兰拥有一个酒庄多少钱？
前两天已经分别说了法国的波尔多、意大利托斯卡纳和美国的纳帕谷拥有一个酒庄多少钱，今天给各位介绍一下在新西兰Marl...
开发笔记目录查看
笔记一：笔记二：笔记三：笔记四：笔记五：笔记六：
目录
羊皮笔记01 羊皮笔记02 羊皮笔记03 羊皮笔记04 羊皮笔记05 羊皮笔记06 羊皮笔记07
《大江大河》笔记若干（一）
后续笔记若干…… 后续笔记若干…… 后续笔记若干…… 后续笔记若干…… 后续笔记若干……

网友评论

本文标题：MARL 笔记

本文链接：https://www.haomeiwen.com/subject/vtprvrtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|MARL 笔记|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！