美文网首页强化学习每日更新ROS/机器人开发实录
2018-07-04 Deep Mind 新文 人类水平的多人游

2018-07-04 Deep Mind 新文 人类水平的多人游

作者: 松山剑客 | 来源:发表于2018-07-05 17:58 被阅读0次

    使用的游戏是《雷神之锤III竞技场》,CTF(Capture The Flag)的游戏规则很简单,但是过程很复杂。游戏双方分成蓝红两队在指定地图中对抗。对抗的目的是保持我方旗帜位于己方基地内,将敌方旗帜从其基地中带到我方基地内,与我方旗帜接触即得一分,在五分钟里得分最多队伍获胜。双方通过射击消灭对方,碰触己方旗帜可以使其回到己方基地。

    Deep Mind 训练的AI名为“为了胜利”(For the Win,FTW),在运行了45万场游戏后,FTW理解了如何有效地与人/其他的机器合作与竞争。

    研究人员对AI的唯一限定是,在5分钟时间里尽可能取得多的旗帜。对战的游戏地图是随机生成的,每场都会变,室内与室外的地形也不相同。在训练过程中,AI发展出了自己的奖励机制,学会了基地防守、尾随队友,或者守在敌人营地外偷袭等策略。

    在验证AI效果时,组队的时候,AI可能与人组队,也可能与其他AI组队。

    DeepMind在他们今天发表的博客文章中写道,从多智能体的角度说,玩《雷神之锤III》这种多人视频游戏,需要与队友合作,与敌方竞争,还要对遭遇到的任何对战风格/策略保持鲁棒性。

    分析发现,游戏中,AI在“tagging”(碰触对方,将其送回地图上的初始地点)上比人类更加高效,80%的情况下能够成功(人类为48%)。

    而且有趣的是,对参与对战的人类玩家进行调查后发现,大家普遍认为AI是更好的team player,更善于合作。

    AI的表现与人类对比

    相关文章

      网友评论

        本文标题:2018-07-04 Deep Mind 新文 人类水平的多人游

        本文链接:https://www.haomeiwen.com/subject/vbbeuftx.html