AlphaGo Zero 之思

作者: 苗栋栋 | 来源:发表于2017-10-21 11:32 被阅读0次

AlphaGo Zero 之思
论文｜ AlphaGo Zero 的模型和算法
AlphaGo Zero 初探
alphago zero初探（一）
从AlphaGo Zero看人类经验知识的有效性和局限性
AlphaGo Zero 最强机器
程序出错，谁的责任？
AlphaGo Zero学习一
AlphaGo Zero学习三
AlphaGo Zero学习二

去年，有个小孩读遍人世所有的棋谱，辛勤打谱，苦思冥想，棋艺精进，4-1打败世界冠军李世石，从此人间无敌手。他的名字叫阿法狗（AlphaGo Go）。

今年，他的弟弟只靠一副棋盘和黑白两子，没看过一个棋谱，也没有一个人指点，从零开始，自娱自乐，自己参悟，100-0打败哥哥阿法狗。他的名字叫阿法元（AlphaGo Zero）。

学习

这两天看了AlphaGo Zero 相关信息想到，学习是给定一个目标，通过反馈不断调整、不断接近目标的过程。

一些看起来不可能的事情，如今看来，也是能不到找到有效的实现路径。

一般的学习是别人给出了有效实现路径，只要照着做就行了。

而没有现成的有效路径的学习，叫做探索，叫做创新。等你完成了这件事情，再总结出一个有效路径来，这样就是一个方法论。

有些人成功了，开始买自己的方法论了。

系统

另外一点，AlphaGo Zero是一个系统，这个系统，有了一个目标就是把自己的围棋越练越好，他按照规则，来一步一步来做，直到达成或更加接近目标。其实这时他已经有了自学能力。

这种能力，对于多数人来说，都不一定具备，或者更准确的说，不一定会用。

系统，最重要的是目标，接着就是连接或规则，最后才是组成要素。

那么公司呢？

战略 > 规则>人。 这些都是无可厚非的。有些CEO说企业比拼到最后都是比拼的人。人才最重要。这个是没有错的。

错就错在，有些人认为，企业在说员工最重要。人重要是因为，那些人是制定战略的，那些人是指定规则的，那些人是负责执行的。

这些人本就有侧重之分。有些人执行的人必定是要站在第一线的。而制定规则和战略的人是必定要站在其后的。这是一种必然的分工。

知道了这些对自己有什么用呢？

每个人都有一个自己所在系统。

你可以换一个系统，无论你在哪里，请先看看自己在那个系统中，要完成什么功能，规则是什么，要素又是什么。

从上到下，从内到外，了解系统，然后在看看自己想要的东西，如何才能获得，如何才能快速获得。

AI未来

一个系统的构成要素是目标，规则，要素。显然，给机器一个目标和规则，加上人类的经验。机器早已开始创作。

如今，机器已不需要人类的经验，就可以自己创作了。

AlphaGo Zero 远比 AlphaGo Go强大，因为它不再被人类认知所局限，而能够发现新知识，发展新策略。

遐想一下，也许当他们可以自己修改目标和规则时，也以为着机器可以创造任意的系统，人不也就是可以创造系统吗？而且还是一个黑盒。

这时的机器，显然已经学会了多纬度学习，完成了自我进化。也许到那时所谓的意识也就有了。

小结：
学习是给定一个目标，通过反馈不断调整、不断接近目标的过程。
系统的构成要素是目标，规则，要素。
当机器可以创造各种系统时，机器就学会了多纬度学习，完成了进化。

网友评论

本文标题：AlphaGo Zero 之思

本文链接：https://www.haomeiwen.com/subject/kjciuxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

AlphaGo Zero 之思

学习

系统

AI未来

相关文章