美文网首页人工智能/模式识别/机器学习精华专题@IT·互联网
从新版AlphaGo40天碾压前任,思考我们如何学习

从新版AlphaGo40天碾压前任,思考我们如何学习

作者: 011ac79d683d | 来源:发表于2017-10-21 20:58 被阅读77次

    假设我们的大脑中也存在“程序代码”。

    大家应该还记得今年5月份AlphaGo(阿尔法狗)以3:0战胜世界围棋冠军、中国棋手柯洁的事吧,然而短短几个月,人工智能又再一次让我们震惊。

    1

    最近谷歌DeepMind团队又开发出了升级版的AlphaGo,命名为AlphaGoZero而且经过40天的自主学习便以压倒性的优势战胜了AlphaGo Master(就是击败柯洁的AlphaGo)

    从DeepMind团队在《自然》杂志上的论文,我们得知了他的成长过程。

    最初DeepMind团队创造出AlphaGo Zero的时候,他除了懂得一些基本的规则,没有任何围棋的基础知识,甚至还把自己玩死。

    经过三个小时的练习和试错,他达到了人类初学者的水平,不会再犯一些低级错误了,但策略上还是很单一。19个小时以后,他学会了策略和技巧。

    70个小时的时候,他开始超越人类的水平下围棋。到了第三天,他就以100:0的成绩战胜了AlphaGoLee(就是16年击败韩国顶级围棋手李世石的版本)

    AlphaGoZero成长曲线

    第21天,AlphaGoZero排位分数已经和AlphaGoMaster差不多了。而到了第40天,AlphaGo Zero以90% 胜率击败了AlphaGoMaster(击败柯洁的版本)

    视频中戴维·席尔瓦告诉我们,AlphaGo Zero是完全从零开始自主学习的。

    19号凌晨两点,柯洁得知后发了这样一条微博,对于AlphaGo的自我进步来讲,人类太多余了。

    2

    这让我突然想起来《奇点临近》书中的观点。

    人类所谓的创造力,计算机一样可以取代,没有什么是机器替代不了的,人和电脑本质上来说并没有什么区别,最底层都是靠一套算法在驱动。

    我们来做个大胆的假设,我们人类的大脑就类似于计算机或运算系统,我们的思考方式和方法技巧就类似于电脑的程序代码。

    我们学习某个知识或技能,就是直接把代码镶嵌到大脑里,当遇到问题,如果某个知识点能去诠释,或某个技能可以解决的问题,那么就会触发这些代码 ,然后运行帮你解决问题。

    同样的, 当我们做一件之前没有做过的事情的时候,我们就是在自己编写代码,等我们完成这件事,那代码就算完成了。而当我们再遇到类似的问题,也可以直接触发。

    3

    程序代码太抽象了,或许查理·芒格的思维模型能更好的诠释这个问题。

    彼得·考夫曼在《穷查理宝典》中收录和总结了查理·芒格的智慧和思维模型,副标题——查理·芒格的智慧箴言录。

    芒格通过不断学习众多学科的知识,进而总结形成自己的思维模型的复式框架,他称作为「多元思维模型」。他说这是影响他生活、学习和决策的思维方法。

    还是太难懂了,简单来说就是核心理论或背后的道理。比如生物学的进化论,物理学的临界点,数学的排列组合原理,社会学的换位思考。

    但是你需要更多的思维模型来解决问题。如果你手里只有锤子,那你眼中的问题就全是钉子,很多人拿着一个锤子去敲所有的问题,显然是行不通的,你还需要有斧头、铁铲、剪刀等等,来面对不一样的问题。

    4

    如何学习思维模型,可以从以下几个方面入手。

    1、通过阅读书籍、观看电影等行为,发现对你有用的方法或思考方式。

    2、总结自己的经历和所见所思,复盘并找出背后的原理。

    3、与他人沟通或拜访名师,学习他人的方法理论。

    如何使用思维模型?

    首先,明确每个思维模型的适用范围,然后通过实践不断的优化和迭代这个模型。

    最后,谢谢大家耐心看到这里,以上是我的思考和总结,能力有限,还正在努力的学习和成长,想了解和学习更多知识的朋友可以直接去看书籍,期待更好的你。


    相关文章

      网友评论

        本文标题:从新版AlphaGo40天碾压前任,思考我们如何学习

        本文链接:https://www.haomeiwen.com/subject/iwdwuxtx.html