上周末连刷了 3 部电影,一部韩国政治类电影 - 《铁雨》,两部纪录片 - 《徒手攀岩》和《AlphaGo》。后面两部的纪录片给人的震撼真的很大,一个是以个人之力与大自然和地心引力较劲,一个是代表全人类去和智能机器较劲。就个人兴趣来说,主要想记录下《AlphaGo》相关的内容,也顺带锻炼下糟糕的文笔。
在影片一开始,DeepMind 找了樊麾和 AlphaGo 对弈,希望他作为专业的棋手能够帮助他们的研究工作。对弈前,樊麾根本没当回事,觉得在围棋上还是人类比机器强,仅仅是电脑程序而已。在进行了几轮对弈后,樊麾越来越不淡定,连输 5 局后独自一人出去散心了很久。当时这场比赛引起了很大的舆论,一些人认为樊麾在国外待太久了,水平多少有点下降,希望能和围棋界的一些高手代表进行比赛。于是,就有了李世石和 AlphaGo 这一局人机围棋大战。
在 AlphaGo 的纪录片中,和李世石对弈的 AlphaGo 是有弱点的,这个是樊麾在和 AlphaGo 的多次对弈中发现的,但当时时间紧迫,没有找出。具体的问题就是,围棋对于 AlphaGo 来说是一整个知识体系,这个体系中的大部分区块它都是理解掌握的,但是某些区块就不太了解了。当时也无法确认 AlphaGo 会在什么情况下触发这些区块,一旦触发这些区块,AlphaGo 程序可能会发生错乱。这也是 DeepMind 团队感到不安的地方。
李世石对战 AlphaGo 会有几个难点。一是对手是一台冷冰冰的机器,比赛过程中无法从对手身上看出任何破绽,能看到的情绪也只是机械手黄士杰沉静的表情。二是 AlphaGo 的手法不像人类,很多时候无法预测它会出怎样的一步棋,打法多变。三是毕竟是机器,无法预测其边界在哪里,而且即使思考很久也不会像人一样感到疲倦。
第一局,李世石输了。赛后发布会表示很震惊,没料到 AlphaGo 的棋艺这么高超,认为之后的胜率是五对五。
第二局中途,李世石出去抽烟,AlphaGo 下了让人震惊的一步(第 37 步)。
专业棋手和点评家都认为这是一个很明显的错误,普通人都不会选择这么下(下在第五线肩冲上),感觉是 AlphaGo 出错了。但在一位 DeepMind 科学家眼中,觉得这是 AlphaGo 自创的一步棋,他为此感到兴奋。去后台查看数据的时候,AlphaGo 也推测人类会下这步棋的概率是一万分之一,符合人类的评论。所以,这也就是,即使它知道这是极不合理的一步,但它仍超越人类的指导,下出了全新的,有创意的,与众不同的一步。
李回来看到这 37 步,先是诧异了一下,然后又笑了一下,最后陷入了思考。在这一步之前,他认为 AlphaGo 只不过是一台靠概率来预测的机器。这一步之后,他觉得原来 AlphaGo 也是充满创意的,且夸赞这 37 步是非常漂亮又创意十足的一步。
第二局,李世石也输了。不止李一个人,在场的人们都感到有点点沮丧。
接着第三局,也输了。沮丧的情绪更严重了。
前三局,李都是带着压力去比赛的。连输 3 局,没了赢局的压力之后,李轻松了不少,整个人的状态也不一样了。
第四局,李世石也下出了令人震惊的一步(第 78 步)。
对应地,AlphaGo 下了不寻常的一步。这一步之后,后台的数据显示 AlphaGo 的胜率立马下降了 8%,是所有对弈中下降最多的,而对应的搜索已经搜索到了 95 步,也是目前达到的最深范围。这之后,AlphaGo 有点失去控制了,下得越来越奇怪,胜率也直线下降,最后认负了。
古力当时称这一步是「神之一手」,李采访说受之有愧,且回答那一步是当时那个场景下唯一的解法。
后来 DeepMind 团队复盘,关于第 78 步 AlphaGo 给出的预测率也差不多是万分之一的概率,一万个人中只有李世石会下这一步,他找出了 AlphaGo 的弱点,赢下了那场唯一胜利的比赛。
这部纪录片拍摄剪辑的挺好的,讲述了许多对弈背后的故事,使得整个对局更完整。尤其是第二局 AlphaGo 的第 37 步和第四局李世石的第 78 步。这两步相互对应,相互衬托。即展现了 AlphaGo 的实力水平和创意性,也体现了李世石的厉害之处。不管是不是 37 步的诞生激发了 78 步的产生,毫无疑问的是,人机结合是最好的搭档。人的智慧结晶出了 AlphaGo 这台智能机器,AlphaGo 又帮助人类挑战极限,以全新的角度看待围棋,增进棋艺。
等模型训练过程中写的一篇文章,语序段序都很乱,谅解哈 :)
网友评论