从新版AlphaGo40天碾压前任，思考我们如何学习

作者: 011ac79d683d | 来源:发表于2017-10-21 20:58 被阅读77次

假设我们的大脑中也存在“程序代码”。

大家应该还记得今年5月份AlphaGo（阿尔法狗）以3：0战胜世界围棋冠军、中国棋手柯洁的事吧，然而短短几个月，人工智能又再一次让我们震惊。

1

最近谷歌DeepMind团队又开发出了升级版的AlphaGo，命名为AlphaGoZero。而且经过40天的自主学习便以压倒性的优势战胜了AlphaGo Master（就是击败柯洁的AlphaGo）

从DeepMind团队在《自然》杂志上的论文，我们得知了他的成长过程。

最初DeepMind团队创造出AlphaGo Zero的时候，他除了懂得一些基本的规则，没有任何围棋的基础知识，甚至还把自己玩死。

经过三个小时的练习和试错，他达到了人类初学者的水平，不会再犯一些低级错误了，但策略上还是很单一。19个小时以后，他学会了策略和技巧。

70个小时的时候，他开始超越人类的水平下围棋。到了第三天，他就以100:0的成绩战胜了AlphaGoLee（就是16年击败韩国顶级围棋手李世石的版本）

AlphaGoZero成长曲线

第21天，AlphaGoZero排位分数已经和AlphaGoMaster差不多了。而到了第40天，AlphaGo Zero以90% 胜率击败了AlphaGoMaster（击败柯洁的版本）

视频中戴维·席尔瓦告诉我们，AlphaGo Zero是完全从零开始自主学习的。

19号凌晨两点，柯洁得知后发了这样一条微博，对于AlphaGo的自我进步来讲，人类太多余了。

2

这让我突然想起来《奇点临近》书中的观点。

人类所谓的创造力，计算机一样可以取代，没有什么是机器替代不了的，人和电脑本质上来说并没有什么区别，最底层都是靠一套算法在驱动。

我们来做个大胆的假设，我们人类的大脑就类似于计算机或运算系统，我们的思考方式和方法技巧就类似于电脑的程序代码。

我们学习某个知识或技能，就是直接把代码镶嵌到大脑里，当遇到问题，如果某个知识点能去诠释，或某个技能可以解决的问题，那么就会触发这些代码，然后运行帮你解决问题。

同样的，当我们做一件之前没有做过的事情的时候，我们就是在自己编写代码，等我们完成这件事，那代码就算完成了。而当我们再遇到类似的问题，也可以直接触发。

3

程序代码太抽象了，或许查理·芒格的思维模型能更好的诠释这个问题。

彼得·考夫曼在《穷查理宝典》中收录和总结了查理·芒格的智慧和思维模型，副标题——查理·芒格的智慧箴言录。

芒格通过不断学习众多学科的知识，进而总结形成自己的思维模型的复式框架，他称作为「多元思维模型」。他说这是影响他生活、学习和决策的思维方法。

还是太难懂了，简单来说就是核心理论或背后的道理。比如生物学的进化论，物理学的临界点，数学的排列组合原理，社会学的换位思考。

但是你需要更多的思维模型来解决问题。如果你手里只有锤子，那你眼中的问题就全是钉子，很多人拿着一个锤子去敲所有的问题，显然是行不通的，你还需要有斧头、铁铲、剪刀等等，来面对不一样的问题。

4

如何学习思维模型，可以从以下几个方面入手。

1、通过阅读书籍、观看电影等行为，发现对你有用的方法或思考方式。

2、总结自己的经历和所见所思，复盘并找出背后的原理。

3、与他人沟通或拜访名师，学习他人的方法理论。

如何使用思维模型？

首先，明确每个思维模型的适用范围，然后通过实践不断的优化和迭代这个模型。

最后，谢谢大家耐心看到这里，以上是我的思考和总结，能力有限，还正在努力的学习和成长，想了解和学习更多知识的朋友可以直接去看书籍，期待更好的你。

网友评论

本文标题：从新版AlphaGo40天碾压前任，思考我们如何学习

本文链接：https://www.haomeiwen.com/subject/iwdwuxtx.html

从新版AlphaGo40天碾压前任，思考我们如何学习