AlphaGo Zero 之思

作者: 苗栋栋 | 来源:发表于2017-10-21 11:32 被阅读0次

去年,有个小孩读遍人世所有的棋谱,辛勤打谱,苦思冥想,棋艺精进,4-1打败世界冠军李世石,从此人间无敌手。他的名字叫阿法狗(AlphaGo Go)。

今年,他的弟弟只靠一副棋盘和黑白两子,没看过一个棋谱,也没有一个人指点,从零开始,自娱自乐,自己参悟,100-0打败哥哥阿法狗。他的名字叫阿法元(AlphaGo Zero)。

学习

这两天看了AlphaGo Zero 相关信息想到,学习是给定一个目标,通过反馈不断调整、不断接近目标的过程。

一些看起来不可能的事情,如今看来,也是能不到找到有效的实现路径。

一般的学习是别人给出了有效实现路径,只要照着做就行了。

没有现成的有效路径的学习,叫做探索,叫做创新。等你完成了这件事情,再总结出一个有效路径来,这样就是一个方法论。

有些人成功了,开始买自己的方法论了。

系统

另外一点,AlphaGo Zero是一个系统, 这个系统, 有了一个目标就是把自己的围棋越练越好,他按照规则,来一步一步来做,直到达成或更加接近目标。其实这时他已经有了自学能力。

这种能力,对于多数人来说,都不一定具备,或者更准确的说,不一定会用。

系统,最重要的是目标,接着就是连接或规则,最后才是组成要素。

那么公司呢?

战略 > 规则>人。 这些都是无可厚非的。有些CEO说企业比拼到最后都是比拼的人。人才最重要。这个是没有错的。

错就错在,有些人认为,企业在说员工最重要。人重要是因为,那些人是制定战略的,那些人是指定规则的,那些人是负责执行的。

这些人本就有侧重之分。 有些人执行的人必定是要站在第一线的。而制定规则和战略的人是必定要站在其后的。这是一种必然的分工。

知道了这些对自己有什么用呢?

每个人都有一个自己所在系统。

你可以换一个系统,无论你在哪里,请先看看自己在那个系统中,要完成什么功能,规则是什么,要素又是什么。

从上到下,从内到外,了解系统,然后在看看自己想要的东西,如何才能获得,如何才能快速获得。

AI未来

一个系统的构成要素是目标,规则,要素。 显然,给机器一个目标和规则,加上人类的经验。机器早已开始创作。

如今,机器已不需要人类的经验,就可以自己创作了。

AlphaGo Zero 远比 AlphaGo Go强大,因为它不再被人类认知所局限,而能够发现新知识,发展新策略。

遐想一下,也许当他们可以自己修改目标和规则时,也以为着机器可以创造任意的系统,人不也就是可以创造系统吗?而且还是一个黑盒。

这时的机器,显然已经学会了多纬度学习,完成了自我进化。也许到那时所谓的意识也就有了。

小结:
学习是给定一个目标,通过反馈不断调整、不断接近目标的过程。
系统的构成要素是目标,规则,要素。
当机器可以创造各种系统时,机器就学会了多纬度学习,完成了进化。

相关文章

  • AlphaGo Zero 之思

    去年,有个小孩读遍人世所有的棋谱,辛勤打谱,苦思冥想,棋艺精进,4-1打败世界冠军李世石,从此人间无敌手。他的名字...

  • 论文 | AlphaGo Zero 的模型和算法

    上一篇文章简单学习了 AlphaGo Zero 的特点: AlphaGo Zero 初探http://www.ji...

  • AlphaGo Zero 初探

    Deepmind 最近发布了 AlphaGo 的最新版本 AlphaGo Zero 的论文,AlphaGo 不再...

  • alphago zero初探(一)

    前段时间被alphago zero刷屏,近期也读了些alphago zero的资料,准备将这些资料做个整理,对al...

  • 从AlphaGo Zero看人类经验知识的有效性和局限性

    DeepMind团队在其官网发布了AlphaGo的最新消息《AlphaGo Zero: Learning from...

  • AlphaGo Zero 最强机器

    2017年10月18日,DeepMind团队公布了最强版AlphaGo ,代号AlphaGo Zero。 看着全网...

  • 程序出错,谁的责任?

    Starting tabula rasa, our new program AlphaGo Zero achiev...

  • AlphaGo Zero学习一

    参考遥行 Go Further《深入浅出看懂AlphaGo元》文章开展学习。 从文中了解到AlphaGo Zero...

  • AlphaGo Zero学习三

    接上文继续学习蒙特卡洛树搜索MCTS和深度神经网络相互应用转化关系。 除上文提到的3位作者文章外,由于不理解下面公...

  • AlphaGo Zero学习二

    接上文继续学习一个新的深度神经网络构成: 方便回顾,下面重复学习一对新的深度神经网络概述: 新的网络中,使用了一个...

网友评论

    本文标题:AlphaGo Zero 之思

    本文链接:https://www.haomeiwen.com/subject/kjciuxtx.html