美文网首页
晒晒两年前的笔记

晒晒两年前的笔记

作者: 山岳之心 | 来源:发表于2021-02-18 23:44 被阅读0次

两年前学Ai的笔记,拿出来晒晒。

学习A.I. 已经一个月了,刷完了吴恩达的机器学习课程,做了所有练习。目前正在学习他的Deep Learning 课程,已经学到卷积神经网络。进度上略慢,但是的确感觉进步了很多。

正值A.I.击败星际争霸2顶级职业玩家的新闻档口,DeepMind 的 AlphaStar 的进步让人印象深刻。A.i. 的脚步真是快的无法想象。不到三年前,A.I. 代表,同样也是DeepMind 出品的 AlphaGo 击败围棋顶级棋手李世石,这已经惊天动地了。没想到,如今在即时战略游戏中,A.I. 已经可以战胜人类顶级选手,比分10:1。这是一件值得注意的成就,但比起/AlphaGo的开天辟地,这种成就实际上不算太了不起。

星际争霸是我上大学时候经常玩的游戏。它有很强的对抗性和趣味性。我还记得当年的Naria, Bisu, Nada, 这些顶级的星际争霸职业玩家。曾经有那么一段时间,我甚至沉迷于这款游戏。

星际争霸是一款非完全信息的游戏,要玩好这个游戏,你需要应对战争迷雾,扩大视野,建造兵营,发展经济,兵种选择,兵种占位,利用地形,等等。可以说是一个相当复杂的游戏,在合适的时间点选择合适的操作是非常重要的。而且重要的是,敌人的动作你无法看到,你不知道对手在干什么。所以侦测就变得非常重要。在游戏录像(https://www.bilibili.com/video/av41685489/)中可以看到,AlphaStar 的操作是完美的,它对于距离的控制也过于完美,实际上这一点对于人类玩家是不公平的。而星际争霸是一个极度依赖微操的游戏,这种完美操作其实不应该出现。

抛开这些实际上的不公平,A.I. 其他的操作,包括野兵营,正面强攻的时机把握得都比人类要好。它对于视野内信息的评价极为精确。游戏中的一些细节也显示出它对于时间的掌握非常精确,比如有个农民在气矿完成之后,本来应该去采气,它却选择等到足够的水晶矿后建造了一个兵营,随后才去采气。这和人类的选择是一致的。所以,这些细微处的精确评价,是A.I.远远超越人类的地方。但其实游戏中还有一些细节,比如AlphaStar的一些兵被分割成了两块后,它对于在对方基地内的那些兵的操作看上去就和以前的电脑一样蠢,这说明A.I.对于需要放弃的兵力的选择不是让它们发挥余热,而是想要摆脱困境。

另外,在Mana赢下AlphaStar的那一局中,Mana采用连续同样的骚扰,不停调动AlphaStar的兵力。它一次又一次的中招,表现的和低级电脑一样愚蠢。这说明它对于经济和农民的权重过大,几乎全体兵力一起出动去守护自己的经济,而一旦敌人消失在迷雾中,它立刻回到原先的主线防御上,而不是选择留下部分兵力来防御敌人再次袭击。这和人类完全不一样。

而Mana攻击AlphaStar二矿的时候,AlphaStar的选择也看起来很愚蠢,它选择了分兵包围的策略。这大概是因为在它的评估体系里,正面无法和Mana对抗,所以采用包围的方案。但这时候即便包围战略成功,二矿和三矿的损失也必然导致失败。所以它对于人类的战术的应对其实远远谈不上聪明。如果是人类玩家,在这时候很可能采取“围魏救赵”的换家策略。凭借微操,AlphaStar很可能会比Mana更快地拆掉对方的基地。这样甚至可以调动Mana的军队回防。

不可否认,AlphaStar是A.I.的一个重大进步。但比起AlphaGo的开天辟地,AlphaStar是一个邯郸学步的笨小孩,它并没有真正理解战术的核心思想。 但是,AlphaStar是一个勤奋的笨小孩,它训练两周就相当于人类训练了200年。任何技战术都最终无法骗过它。目前来说,它对于迷雾内的判断和评估几乎是空白,但这并不代表它未来无法进行评估。它最终会发现类似于围魏救赵这样的策略。

原则上来说,人类的战术其实是基于当前局势的合理操作。本质上都是可预测的。但现实生活不会有明确的科技树和千篇一律的技战法,还有很多超出预知的不可控因素存在。所以DeepMind声称的可以做天气预测之类的声明,实质上是过于乐观的想法。大气动力学是高度非线性的,本质上无法做长期预测,存在很多意料之外的强扰动因素。

很多机器学习的学者对于机器学习本身过于乐观。在他们眼中,万物皆可算,实质上是很幼稚的想法。以一个理论物理学者的眼光看来,机器学习的本质技术还是微扰论,就是泰勒展开。这是非常非常局限的算法,超出微扰论的范畴它会表现的很愚蠢。还有一点就是机器学习目前的技术还没有提升到动力学的层次,这意味着计算机无法理解动态逻辑。它可以理解图片,但无法理解电影。这其实说明机器学习目前还处在物理学中的静力学层次,对于物理学而言,差不多仅相当于19世纪初的水平。

现代物理的发展水平已经远远超越了微扰论和静力学这一层次。组合拓扑,拓扑纠缠,强弱对偶理论等等更是机器学习的泰勒展开远远无法企及的高度。而机器学习目前连动力学这一层都还没有捅破。目前的机器学习和19世纪中后期的物理学很相似,都在欢呼统一。但物理学早就欢呼过统一很多次了,事实证明,每一次欢呼统一的背后总是在展示人类本身的浅薄。

在AlphaStar公布的算法中,并没有超越当前的革命性进展。仍然是深层神经网络下的监督学习和强化学习。它的革新之处在于生成对抗网络的新算法,但这仍然类似于遗传进化算法,也并非是颠覆性的算法。

我之所以用现代物理来类比,是因为机器学习目前已经可以算得上是真正的严肃科学。既然是严肃科学就必须用科学的方法来审视它。机器学习目前处在静力学阶段,这恰恰说明它有巨大的潜力。A.I.的革命大潮已经扑面而来,势不可挡。下一个世代,理论物理学和机器学习将会深度结合,两者在方法论和研究路径上都非常类似。时间序列问题,动力学预测问题,都将会从物理学的拉格朗日力学中获得养分。全新的深度学习框架将会更加强大。

其实在我看来,机器学习的研究者们早就开始拥抱理论物理了。机器学习教父 Hinton 近期的主要工作是玻尔兹曼机和受限玻尔兹曼机。熟悉统计物理的人都知道,所谓玻尔兹曼机其实就是物理学中非常著名的Ising模型,实际上更具体的说是1+1维Ising 模型。这个模型非常简单,严格解都可以很容易写下。这说明机器学习的开拓者们在内心深处是将机器学习本身看作是一种统计物理学的,是一门严格的科学。为什么要研究玻尔兹曼机?其实原因很简单,机器学习的学者们想要跳出泰勒展开的微扰框架,进入到非微扰领域。因为 Ising 模型本身就是一个非微扰模型,它属于强关联电子系统。但其实机器学习本身还没有完全搭好微扰论的框架,第一步应该做的是场论,路径积分,对称性自发破缺这种微扰论框架下被奉为圭臬的理论转化为机器学习算法。这一次,需要理论物理学家们去拥抱机器学习。

最后说一点关于神经网络的看法。神经网络有输入层,隐藏层,输出层三种基本结构。神经网络的前向传播算法总结起来就是1.参数随机化,2. 选择每一层的激活函数,比如线性-ReLu-线性-ReLu-Logistic, 3. 计算Cost function。 而反向传播算法主要是计算参数的导数,然后进行更新,迭代原则还是要让Cost Function 最小化。这里有很多技术细节,比如Cost Function 需要正规化,对于数据本身需要做mini-batch, 还需要在mini-batch之间做迭代速率衰减,用momentum或者Adam来做优化等等。这些过程看起来很复杂,但学过物理的人都能明白这些其实都是很自然的表示基变换。本质上,神经网络在数学上类似于求一个Quiver Lie Algebra 的表示。涉及的算法内核也类似于求解Clebush-Gordon系数。迭代的原则类似于找到特定表示的Quiver表示分解。实际上,如果做过Quiver Gauge Theories 的人会比较容易理解神经网络,因为很多思想都几乎是一致的。为什么层数和单元数对于神经网络的训练效果影响非常大?其实很简单,因为数据本身内含了某种Quiver对称性!用更专业的数学物理眼光来看,任何形状的出现都是对称性破缺的结果,所以总可以从高度对称的出发点寻找到对称破缺的路径,使得最终的形状满足对称破缺后的Quiver对称性。所以,机器学习的某些结果恰恰在印证现代数学物理的结果。

未来已来,理论物理学的学者们,拥抱人工智能吧。

相关文章

  • 晒晒两年前的笔记

    两年前学Ai的笔记,拿出来晒晒。 学习A.I. 已经一个月了,刷完了吴恩达的机器学习课程,做了所有练习。目前正在学...

  • 晒晒我多年前的手抄……

    高嘉慕 先生收拾东西,拿出三个旧本子放在桌上,对闺女说:“要不要看看你妈以前写的...

  • 啥也不说了,晒晒我的《禅宗兴起》读书笔记

    啥也不说了,晒晒我的《禅宗的兴起》读书笔记,上图:

  • 少儿卡通连环画节选

    二十年前正式出版的作品,晒晒吧,别发霉。

  • 爱褪了色更纯洁?

    一两年前写东西,放在箱子底下长霉了,拿出来晒晒——by jora 昨天面试回来,走在喧闹的地铁站,抬头看见通道两旁...

  • 晒日常04——喜欢拈花惹草的书桌

    我就在这献丑啦,小女住在公司的单身宿舍,和一个美女一起住。晒晒我的书桌。 我用的是i3系统的华硕笔记本,五六年前买...

  • 神奇的天才—费曼(4)

    今天继续晒晒旧文章。这是六年前写的读书笔记 记得爱因斯坦和几个志趣相投的人创办过一个奥林匹亚学院,是物理史上一个佳...

  • 晒晒晒

    中国人过年, 一个字“晒”! 晒车、晒房、晒场面、晒存在感。 晒脸、晒腰、晒美颜、晒美貌感。 晒吃、晒喝、晒旅游、...

  • 晒晒晒

    工作时凭心去做,不是给谁干的,更不是干给谁看的,高调不用唱,告诉自己的心就好! 下班了,把家收拾的...

  • 晒晒晒

    现在是小年夜,明天就除夕了。 朋友圈里满满的都是好吃的好玩的,而我今天上午还在上班,下午回来后洗了一大堆东西,大概...

网友评论

      本文标题:晒晒两年前的笔记

      本文链接:https://www.haomeiwen.com/subject/vidoxltx.html