美文网首页
MARL 笔记

MARL 笔记

作者: AntiGravity | 来源:发表于2022-06-19 16:09 被阅读0次

16年的MARL概览: A comprehensive survey of multiagent reinforcement learning(谷歌学术)

Model-free时学习均衡:

  • Nash Q-learning:仅在强假设收敛,多个收敛点。(类似的有MADDPG、Mean-Field Q-learning)
  • Stackelberg 均衡:越合作越优于Nash均衡,且仅有一个收敛点,是帕累托最优点。

Model-based时学习均衡:

  • Minimax-Q method

协同(对其他agent建模)

PR2(Probabilistic Recursive Reasoning)

合作(MA共享同一个reward)

通讯 - Multiagent Bidirectionally-Coordinated Net
集中训练分布执行 - Multi-Agent Actor-Critic for Mixed Cooperative-Competitve Environments

相关文章

  • MARL 笔记

    16年的MARL概览: A comprehensive survey of multiagent reinforc...

  • 558  A Visitor in Marl泥土里的访

    A Visitor in Marl Who influences Flowers Till they are or...

  • Papers of Multi Agent Reinforcem

    Papers in Multi-Agent Reinforcement Learning(MARL) This i...

  • Marl&Kars

    世人皆知,巴黎时尚界有一个奢侈品牌名为Marl&Kars,各年龄阶层的男男女女都为它着迷。却少有人知晓,它的来历…...

  • Marl&Kars

    世人皆知,巴黎时尚界有一个奢侈品牌名为Marl&Kars,各年龄阶层的男男女女都为它着迷。却少有人知晓,它的来历…...

  • Marl&Kars

    世人皆知,巴黎时尚界有一个奢侈品牌名为Marl&Kars,各年龄阶层的男男女女都为它着迷。却少有人知晓,它的来历…...

  • 何哥说酒:在新西兰拥有一个酒庄多少钱?

    前两天已经分别说了法国的波尔多、意大利托斯卡纳和美国的纳帕谷拥有一个酒庄多少钱,今天给各位介绍一下在新西兰Marl...

  • 开发笔记目录查看

    笔记一: 笔记二: 笔记三: 笔记四: 笔记五: 笔记六:

  • 目录

    羊皮笔记01 羊皮笔记02 羊皮笔记03 羊皮笔记04 羊皮笔记05 羊皮笔记06 羊皮笔记07

  • 《大江大河》笔记若干(一)

    后续笔记若干…… 后续笔记若干…… 后续笔记若干…… 后续笔记若干…… 后续笔记若干……

网友评论

      本文标题:MARL 笔记

      本文链接:https://www.haomeiwen.com/subject/vtprvrtx.html