美文网首页
论文阅读:Graph Convolutional Reinfor

论文阅读:Graph Convolutional Reinfor

作者: syat_e6da | 来源:发表于2021-01-05 15:38 被阅读0次

    这篇论文主要介绍了DGN的算法,在DQN的基础上加了图网络,用于状态的融合。在多智能体环境下运用。relation kernel用的是self-attention。


    论文算法框架

    这篇论文提到的几个点:

    1. 因为智能体之间的关系变化太快了,所以图动态变化太快,不利于收敛,所以在连续2个时间点保持图暂时不变。


    2. unlike other methods with parameter-sharing, e.g., DQN, that sample experiences from individual agents, DGN samples experiences based on the graph of agents, not individual agents, and thus takes into con- sideration the interactions between agents.(这个没太看懂,怎么根据图来sample呢?)

    3. Temporal Relation Regularization.



    这篇论文和论文:Deep Reinforcement Learning with Relational Inductive Biases. 都用到了图网络和强化学习的结合,都提到了relational reinforcement learning 这个概念。有机会可以了解一下。

    相关文章

      网友评论

          本文标题:论文阅读:Graph Convolutional Reinfor

          本文链接:https://www.haomeiwen.com/subject/mptwoktx.html