【荐片】AlphaGo官方纪录片

作者: 微力 | 来源:发表于2018-01-15 10:44 被阅读175次

【荐片】AlphaGo官方纪录片
论基础教育阶段学生高阶思维的培养
从时间与复利的角度看AlphaGo
看AlphaGo纪录片有感
观后感
推荐一部我喜欢的纪录片《故宫》
如何做自我梦想的造梦者？
记 AlphaGo 纪录片 - 37 对 78
荐｜纪录片《紫禁城疑案》
生活方式 | 饮食哲学，芬兰小生活，还有《Game Change

写在前面：从人类发明语言之后，主要的学习方式就是通过文字。但是，好的视频，尤其是纪录片，却能够通过直观的视觉，给我们更多的代入感。今天就先给大家推荐这一段吧。

alphago的官方纪录片，带你重温2017年那激动人心的时刻。先简要交代下背景：英文被称作Go的围棋，是诞生于中国，已经具有三千年历史的一项棋类运动。和它的英文名字一样，其元素和规则非常简单，但是变化却非常多，被称作最复杂的棋类项目。 DeepMind是一家位于伦敦的人工智能初创公司，他的创始人之一杰米斯·哈萨比斯，是英国青少年国际象棋冠军，他打算借助人工智能，在最复杂的棋类项目上扛过机器对抗人类的大旗。自从1997年IBM的深蓝击败国际象棋世界冠军卡斯帕罗夫之后，科技界一直试图在更复杂的围棋领域用机器挑战人类，但18年过去后，棋力最高的人工智能程序才能达到业余五段的围棋水平。DeepMind决心改变这一现状，在2014年启动了AlphaGo项目（DeepMind也是在这一年被Google收购），他们的信心来自于近几年机器学习和深度学习的飞速发展，使得机器具有了自我学习和进化的能力，至少从表面上看AlphaGo一两年内下的棋局，已经远远超过职业棋手从小到大做下的棋局总数了。

这个纪录片主要的内容，就是AlphaGo和李世石之间的”人机大战“。其中的几个细节颇有看点：

博弈

围棋是一种博弈的游戏，在这个五番棋里，双方都试图把局面搞得很复杂，让对方琢磨不透。职业棋手会通过对方思考的时间长短以及观察对手的反应，来验证自己的这种战术是否成功了。但是这一次，李世石的对面只是帮助落子的黄仁杰博士，每一次落子都是1-2分钟，黄博士更是面无表情，根本无法观察对方的反应。围棋在古代被称为”手谈“，可以说通过围棋能够实现双方的某种交流，在这个五番棋的比赛中，唯一的交流就是棋谱，或者数据（对机器而言）。

上帝之手

比赛中有两手被反复提及（不剧透了），一个由AlphaGo”创造“，出乎了所有人的意料，但是仔细一分析，这一手将此前大家看不懂的复杂局面变得更明朗了，说明AlphaGo做了一个大局，主导了比赛；此时的AlphaGo有48个TPU（张量处理器，机器学习专用芯片），可以计算50步，所以布下这个局也不奇怪。另一个，则由李世石创造，出乎了AlphaGo的预料，这一首被古力成为”God Move“。在赛后的复盘中，程序员说这一步发生的概率是十万分之七。而李世石在赛后发布会上说当时只有这个地方可以下。说明，李世石也在从前三局的失败中进行学习，在跟AlphaGo比赛完的两个月内，李世石保持全胜。

人机竞合的魅力

”世纪之战“改变了人工智能，也改变了围棋这项运动。 “看起来不可能战胜机器”，并没有让围棋这项运动失去魅力，却让这项运动有了更高的知名度和广泛参与度。据说，在比赛结束后，围棋的棋盘一度卖断了货。连李世石也表示，AlphaGo的出现，改变了围棋这项运动，他（作为对手的AlphaGo）提供了很多前人没有想过的思路，让围棋有了更多的可能性。说实话，我不懂围棋，在看这个纪录片之前，只在武侠小说里，听说过珍珑棋局，这是个围棋术语，指全局性的巧妙创作，特点在于构思奇巧。而纪录片中的上帝之手，无疑就是现实版的珍珑棋局。也许，随着机器棋手的加入，在机器和人的“同伎压力”下，会产生更多的珍珑棋局。

后续故事

在围棋人机大战总战胜人类，可以说人工智能摘取了智力运动上的“明珠”。 AlphaGo仍在不断迭代，他的下一个版本AlphaMaster，在网络上60比0，战胜了一众专业棋手；然后在乌镇3：0战胜了柯洁，1：0在与人类团体赛中胜出。而且与战胜李世石的具有48个TPU的分布式系统不同，这一版只用了4个TPU的单机系统。

然后，AlphaGo就不屑于跟人类玩了，第三代AlphaGo Zero，基于神经网络完全重新开发，丝毫不依赖人类的经验，只是自己跟自己下，“通过对自我的反思和独有的创造力直接超越人类”。然后AplhaGo zero100：0完胜第一代AlphaGo（胜李世石版本），在跟第二代AlphaGo Master对战中保持90%的胜率。

故事还没有接触，第四代叫做Alpha Zero（注意已经去掉了Go），仍旧使用第三代算法，但是使用更通用的变量，可以应用到其他的棋类项目，包括可能有平局的国家象棋（围棋没有平局）。

但是，这绝不是DeppMind的最终目的。所有研究人工智能的公司，其目标都是研发出通用的人工智能，并能广泛的应用，然后反哺人工智能的算法和模型。

从DeepMind的官网，可以看到通过使用AlphaGo中积累的AI技术，DeepMind帮助谷歌的数据中心降低了40%的能耗（谷歌这钱花的值），Google Assistant中的语音识别技术也使用了DeepMind的卷积神经网络算法。相信在谷歌强大的计算能力和海量数据下，DeepMind会有更好更大的发展。

PS： DeepMind这种通过在特定规则的游戏中训练AI，从而获得自我学习和进化的能力（这有点像协同过滤了）的做法，也得到了很多其他公司的效仿。在围棋领域，就有Facebook、腾讯等公司。还有诸如电竞和其他棋牌领域。大家有兴趣可自行围观。

雷锋网的相关视频汇总贴，汇集了2017年AI领域的一些比较浅显一定的精华，我帮大家简要概括如下：

Libratus：卡耐基梅陇大学人工智能系统，在20天赛程里击败了德州扑克的职业选手，德州扑克背后的不完全信息博弈，与围棋不同的是德州扑克的每一步决策，都是以前所有步骤的条件概率。

OpenAI：在Dota2国际竞标赛现场1V1击败世界顶级玩家，这同样是不依赖与人类经验，完全自主学习进化的有一个例子；

DeepMind的自动化神经网络架构：这个厉害了，联合 CMU 提出一种结合模型结构分层表示的高效架构搜索方法，使用神经网络来设计神经网络，并且超过的人工设计的架构；

地表最强的国际象棋选手：对，就是AlphaZero，同样通过自主学习，击败目前最强的国际象棋机器选手Stockfish（ELO分3300，比人类最高的卡尔森还高500分，意味着胜率95%以上）；

当然，少不了AI领域的大拿，吴恩达、李飞飞、谷歌大脑团队以及深度学习之父Geoffrey Hinton。感兴趣的童鞋请移步2017AI年度视频。