游戏夜读 | 在游戏中打败人类

作者: 良宵听雨 | 来源:发表于2019-05-24 13:42 被阅读8次

    一系列的惊喜!以及错愕,还有期待。

    2017年3月,人工智能Libratus在宾夕法尼亚州挑战美国顶尖德州扑克游戏玩家,在12万手比赛后,Libratus完胜全部4个对手。Libratus使用的“强化学习”方式能让计算机生成更具创造性的策略,在信息不完全的情况下作出更好的决策。5月,强化版围棋人工智能AlphaGo在中国乌镇3:0战胜世界第一棋手柯洁,并与八段棋手协同作战在组队战中全胜5位顶尖九段棋手。AlphaGo的第一个版本使用来自人类专家的训练数据进行引导,通过自我下棋和对蒙特卡洛树搜索稍加改动进行进一步的改进。10月,横空出世的AlphaGo Zero仅通过40天的学习就战胜了自己的双胞胎兄弟AlphaGo Master。AlphaGo Zero采用无监督学习,从零开始,不需要任何人类的经验,并通过强化学习发现了新的围棋定式。AlphaGo Zero还优化了核心算法,将策略网络和值网络结合,并引入深度残差网络,用更少的算力得到了更好的结果。

    2017年底,我们看到了AlphaGo Zero算法的另一个演绎:AlphaZero,它不仅精通围棋,还精通国际象棋和日本象棋,使用了一模一样的技术。有意思的是,这些软件走的步连经验最丰富的围棋选手都感到惊讶,激励围棋选手向AlphaGo学习,相应地调整自己的棋风。为了让这更容易,DeepMind还发布了AlphaGo 教学工具。围棋不是我们取得重大进展的唯一游戏。

    强化学习的下一个领域似乎是更复杂的多人游戏,包括多人扑克,电子竞技。

    DeepMind正在积极研究《星际争霸2》,发布了一种研究环境。与此同时,Libratus是卡内基•梅隆大学的研究人员开发的一个系统,它在为期20天的“一对一无限注德州扑克”(Heads-up, No-Limit Texas Hold’em)标赛中成功击败了顶尖扑克玩家。稍早些时候,查尔斯大学、捷克技术大学和艾伯塔大学的研究人员共同开发的DeepStack系统成为第一个击败职业扑克玩家的系统。请注意,这两个系统玩的都是单挑扑克比赛,这在两名玩家之间进行,比多个玩家扑克比赛容易得多。OpenAI在1v1 Dota 2中展示了初步的成功,目的在于在不远的将来能够玩转真正的5v5游戏。

    然而,在这些激动人心的背后,是大把的钞票。比如DeepMind。

    2017年,DeepMind亏损3.02亿英镑,相当于人民币27亿元。这个数字同比增长了221%。同期,DeepMind的员工成本大增。简单估算一下,这家公司员工的平均年薪:250万元(人民币)。不过,DeepMind的商业化能力还没有同步猛增。但是不用担心,虽然烧钱速度快得惊人,但Google依然支撑得起。DeepMind在报告中说,Google会在至少未来12个月时间里,继续向他们提供充足的财务支持,还写下了书面保证。

    早在2016年,DeepMind在联合创始人穆斯塔法·苏莱曼(Mustafa Suleyman)的领导下,作为其应用团队的一部分成立了健康部门。该团队的目标一直是在现实环境中开发和部署人工智能技术,包括家庭医生诊所和医院,但到目前为止还没有商业产品,该部门尚未产生任何收入。此外,在英国和美国,该公司其他健康项目还包括一个医疗诊断应用程序,以及一个使用人工智能来分析医学扫描的(数据)流和程序。

    2018年11月,DeepMind宣布将把其健康部门的控制权移交给加州一个新的谷歌健康部门,这表明该公司计划将努力进行扩张和商业化。在2019年3月的一次人工智能系统的现场演示中,DeepMind对一名患者进行了视网膜扫描,并对该女性患者的眼睛进行了实时诊断。扫描结果由谷歌云中的一组算法进行分析,这些算法在大约30秒内就给出了(疾病)紧急程度评级和详细诊断。

    该系统能够检测包括青光眼、糖尿病性视网膜病变和老年性黄斑变性在内的一系列眼病,其准确度与世界领先专家水平相当。该产品原型是在过去三年中与伦敦Moorfields眼科医院合作开发的。有关这项研究的细节发表在去年8月的科学杂志《自然医学》(Nature Medicine)上。

    但这些尚未批准进入大众领域。后面的故事可能就像《权力的游戏》一般开始越来越复杂和无趣了。

    相关文章

      网友评论

        本文标题:游戏夜读 | 在游戏中打败人类

        本文链接:https://www.haomeiwen.com/subject/giegzqtx.html