记 AlphaGo 纪录片 - 37 对 78

作者: 捡个七 | 来源:发表于2019-07-08 13:10 被阅读0次

记 AlphaGo 纪录片 - 37 对 78
福彩三D2018年第38期两码组合！
从时间与复利的角度看AlphaGo
观后感
看AlphaGo纪录片有感
WebStrom for mac破解版下载和使用
350期请开始你的表演
同时迭代多个序列
纪我的2018
【荐片】AlphaGo官方纪录片

上周末连刷了 3 部电影，一部韩国政治类电影 - 《铁雨》，两部纪录片 - 《徒手攀岩》和《AlphaGo》。后面两部的纪录片给人的震撼真的很大，一个是以个人之力与大自然和地心引力较劲，一个是代表全人类去和智能机器较劲。就个人兴趣来说，主要想记录下《AlphaGo》相关的内容，也顺带锻炼下糟糕的文笔。

在影片一开始，DeepMind 找了樊麾和 AlphaGo 对弈，希望他作为专业的棋手能够帮助他们的研究工作。对弈前，樊麾根本没当回事，觉得在围棋上还是人类比机器强，仅仅是电脑程序而已。在进行了几轮对弈后，樊麾越来越不淡定，连输 5 局后独自一人出去散心了很久。当时这场比赛引起了很大的舆论，一些人认为樊麾在国外待太久了，水平多少有点下降，希望能和围棋界的一些高手代表进行比赛。于是，就有了李世石和 AlphaGo 这一局人机围棋大战。

在 AlphaGo 的纪录片中，和李世石对弈的 AlphaGo 是有弱点的，这个是樊麾在和 AlphaGo 的多次对弈中发现的，但当时时间紧迫，没有找出。具体的问题就是，围棋对于 AlphaGo 来说是一整个知识体系，这个体系中的大部分区块它都是理解掌握的，但是某些区块就不太了解了。当时也无法确认 AlphaGo 会在什么情况下触发这些区块，一旦触发这些区块，AlphaGo 程序可能会发生错乱。这也是 DeepMind 团队感到不安的地方。

李世石对战 AlphaGo 会有几个难点。一是对手是一台冷冰冰的机器，比赛过程中无法从对手身上看出任何破绽，能看到的情绪也只是机械手黄士杰沉静的表情。二是 AlphaGo 的手法不像人类，很多时候无法预测它会出怎样的一步棋，打法多变。三是毕竟是机器，无法预测其边界在哪里，而且即使思考很久也不会像人一样感到疲倦。

第一局，李世石输了。赛后发布会表示很震惊，没料到 AlphaGo 的棋艺这么高超，认为之后的胜率是五对五。

第二局中途，李世石出去抽烟，AlphaGo 下了让人震惊的一步（第 37 步）。

专业棋手和点评家都认为这是一个很明显的错误，普通人都不会选择这么下（下在第五线肩冲上），感觉是 AlphaGo 出错了。但在一位 DeepMind 科学家眼中，觉得这是 AlphaGo 自创的一步棋，他为此感到兴奋。去后台查看数据的时候，AlphaGo 也推测人类会下这步棋的概率是一万分之一，符合人类的评论。所以，这也就是，即使它知道这是极不合理的一步，但它仍超越人类的指导，下出了全新的，有创意的，与众不同的一步。

李回来看到这 37 步，先是诧异了一下，然后又笑了一下，最后陷入了思考。在这一步之前，他认为 AlphaGo 只不过是一台靠概率来预测的机器。这一步之后，他觉得原来 AlphaGo 也是充满创意的，且夸赞这 37 步是非常漂亮又创意十足的一步。

第二局，李世石也输了。不止李一个人，在场的人们都感到有点点沮丧。

接着第三局，也输了。沮丧的情绪更严重了。

前三局，李都是带着压力去比赛的。连输 3 局，没了赢局的压力之后，李轻松了不少，整个人的状态也不一样了。

第四局，李世石也下出了令人震惊的一步（第 78 步）。

对应地，AlphaGo 下了不寻常的一步。这一步之后，后台的数据显示 AlphaGo 的胜率立马下降了 8%，是所有对弈中下降最多的，而对应的搜索已经搜索到了 95 步，也是目前达到的最深范围。这之后，AlphaGo 有点失去控制了，下得越来越奇怪，胜率也直线下降，最后认负了。

古力当时称这一步是「神之一手」，李采访说受之有愧，且回答那一步是当时那个场景下唯一的解法。

后来 DeepMind 团队复盘，关于第 78 步 AlphaGo 给出的预测率也差不多是万分之一的概率，一万个人中只有李世石会下这一步，他找出了 AlphaGo 的弱点，赢下了那场唯一胜利的比赛。

这部纪录片拍摄剪辑的挺好的，讲述了许多对弈背后的故事，使得整个对局更完整。尤其是第二局 AlphaGo 的第 37 步和第四局李世石的第 78 步。这两步相互对应，相互衬托。即展现了 AlphaGo 的实力水平和创意性，也体现了李世石的厉害之处。不管是不是 37 步的诞生激发了 78 步的产生，毫无疑问的是，人机结合是最好的搭档。人的智慧结晶出了 AlphaGo 这台智能机器，AlphaGo 又帮助人类挑战极限，以全新的角度看待围棋，增进棋艺。

等模型训练过程中写的一篇文章，语序段序都很乱，谅解哈 :)