10月19日,谷歌DEEPMIND团队对外宣布了他们最新的研究成果:在不学习人类棋谱的情况下,直接用深度学习的机器跟原来的AlphaGo对弈训练了36天之后,终于打败了AlphaGo(阿尔法狗),他们把这台新的机器命名为Alpha Zero(阿尔法元).这一次的结果再次刷新了机器人下棋的一次里程碑,到目前为止成为最强大的棋谱。显然36天的成绩超出了科学家的想象,Alpha Zero(阿尔法元)更为让人震惊的是仅用了4个TPU,它哥哥AlphaGo(阿尔法狗)用了48个TPU,依然不是他的对手。除了硬件上的差别,阿尔法狗是在学习了人类棋谱之后,战胜了李世石,柯洁等人类高手,而阿尔法元是一张白纸,只是给它围棋规则和输赢的标准,左右手对弈,机器自主学习,没有给它任何指导的情况下,完成了它的整个学习和训练。这给了我们什么样的启示呢?
1. 人类的棋谱一直以来自认为是完美的棋谱,但是通过这次的较量我们知道了人类棋谱也有不少的“杂音”,只是我们一直没有发现而已。2. 其实还有一些解决问题的思路比现有存在的好的很多,但是人类并没有发现,然后自定义为“没有了”。机器的思路也许是一种人类还有待发展的思路,机器解决问题的“黑匣子”,就是人类思维的一个盲区,也是为人类解决问题打开另外一个世界。人类可以随着认知变化而成长变化。3. 机器解决问题必须事先设定好的规则下面进行,如果没有规则定义,机器也无法进行工作。而现实解决问题的环境是非常复杂和变化的,存在着“理想环境”的条件不多。因此,目前人工智能只能替代“重复性劳动”的工作机会比较多。4. 说到彻底,这次的突破还是算法的问题,阿尔法元在不借助人类任何经验数据的情况下实现了算法超越了人类的历史性的一步,本质还是计算的问题,围棋复杂程度大约是10 的172次方。 由阿尔法元“完爆”阿尔法狗想到“Stay Hungry, Stay Foolish”乔帮主这句话给我们的启示:人类只要保持一颗学习的心,保持一颗谦卑的心,就能跟世界一起前进,活在未来。
网友评论