美文网首页
4.23世界读书日:如何像训练AI一样训练自己?

4.23世界读书日:如何像训练AI一样训练自己?

作者: 人间小书童 | 来源:发表于2024-04-22 19:23 被阅读0次
    4.23世界读书日

    4.23,世界读书日,用一本书,纪念这个美好的日子,也致敬这个美好的时代。

    不知道大家近期会不会有这样一种感受:在“百模大战”的背景下,日常生活中好像不会用点AI大模型就感觉与世界脱轨了。

    在听万维钢老师新书《拐点》的时候,让我对大模型时代的发展又有了一些新的认识,想要训练一个语言大模型,有个关键步骤是非常值得注意的,就是“强化学习”。现在AI技术进展之所以如此之快,很大程度上得益于这个强化学习。

    对于我而言,对于任何新技术都是满怀敬畏,但却从不因为新技术而迷失自我,关注新技术发展的同时,我更希望关注的是“个体”本身,任何新工具的出现,都是为了解决一些社会发展中本身存在的矛盾,而非是为了替代某些东西。

    我不是新技术的发明者,我没法跟大家探讨大模型应该怎样,我还是喜欢回归到人本身上来,如何像训练AI一样训练自己,让自己在新技术包围下同样具有竞争力,这才应该是我们个体应该花更多精力去关注的事情。

    今天就跟大家来聊一聊这个“强化学习”。

    强化学习是一门关于反馈、学习和迭代的技术。你会发现:学习、反馈、迭代,这不正是我们每个人都一直在经历的过程吗。从这个角度来看,AI迭代的方法,有没有可能被咱们人类来借鉴一下呢?我认为,这应该是可以的。

    从社会发展的角度来看,这些年一直存在一种客观现象:

    脑科学给AI研究提供了灵感,AI研究也反过来给脑科学提供了思路。和AI一样,人的大脑和身体本质上也是由若干个神经网络组成的。我发现:神经网络的训练和控制,这个视角对人的成长特别有启发。

    可以试着把【仿生学】反过来用,尝试用【仿AI学】,看看我们自身能从神经网络的训练和控制中学到什么。

    如果你曾经也过关注有关社会学的研究就会发现,人的行为习惯、性格特征、情绪表现等一系列的禀赋特征都有神经网络的性质。甚至在万维钢老师看来,佛学中的【业力】也可以理解为神经网络。

    有一个企业家,也是一个洞见输出者,叫肖恩.帕里什,他写了一本《清晰思考》,总结了一些科学决策与行动的方法,我们可以借鉴他的结论,结合神经网络的思路,关注我们生活日常中的一些小事,在一些微不足道的小事细节上,清晰思考,做出正确的选择,从而日积月累,摆脱平庸陷阱。

    感性大于理性,这是人之所以为人的最基本特质,在我们自己的事情上尤为明显,神经网络构建了我们的本能反应,我们本身就是感性的动物,不管你如何标榜理性,我们总会在本能地、自动地做很多事情,而其中很多选择,本身就是不理性的,是错误的。

    想要少犯错、不平庸,非常困难,因为你是在跟自己的感性本能作对,你需要比你的一些神经网络更凶。

    一个常用的策略就是暂停本能反应,最好的方式就是嵌入某种仪式。

    比如我们看篮球运动员罚篮。他们从来都不是拿过球来站好就投,而是一定要先把球在原地不紧不慢拍几下,找找感觉,完了再投。这就是暂停。场上所有队员、场边那么多观众都得等着,因为运动员必须要把心绪从刚才的激烈争夺中切换到眼前这个静止罚球的状态上来,要确保清晰思考。

    这个动作说起来简单,实际做起来很难,在你情绪高涨的时候,突然中止,暂停一会,在继续下一个动作。如果你也能做到,你就会发现,生活中的很多错误,可能都可以避免了。

    可能在一些传统的观念里,很多人总是喜欢抱有一种侥幸心理:觉得越不认真,越不写意、越放纵就能打赢越厉害的人,认为赢还不行,还得赢得不费力才能体现美感,最好是昨天通宵刷视频,今天早上还能生龙活虎……这本身就是非常愚蠢的文艺妄想。

    不费力的赢只能赢普通人,说明你爱打平庸的赛,你赢不了高手。能豁得出去自己,舍得投入比别人更高的能量,才是真正的强势。

    姚明每次罚球之前都运球5下,你为什么不能在回应别人的争议之前深呼吸3次呢?停顿会让你的形象更有力量。

    比停顿更难的是知道什么时候停顿。我们太容易按照某种默认模式自动行动。莫里什认为,改善行动的方法不是用意志力战胜默认模式,而是用好的默认模式取代坏的默认模式。

    我们应该在每次发言之前,自动深呼吸,调整惯性,让身心保持放松回归理性。我们不是取消惯性,而是要用好的惯性。

    如果我们把自己想象成一个由若干个神经网络组成的AI,那么本质上就是神经网络训练的问题。

    主要策略有两个,即控制和改写:一个是想办法控制我们与生俱来的不好的神经网络,也就是我们的弱点。另一个就是主动训练几个好的神经网络,以至于遇到相关的情况能够自动的做出正确的反应。

    先说后者,有点逆天改命的意思,如果考虑到人本身就是台生物机器,我们要做的就是从硬件层面进行升级,升级出一套强势的人格来。强势,其实就是高标准。

    一般人理解标准是一种管理规则,是做给别人看的,是一个量化的考核结果。既然是规则就会有意外,而意外的发生,就会容易衍生出人本能反应,从而被感性控制。

    所以,在帕里什眼中,标准并不是管理规则,标准是训练神经网络的素材库。垃圾进就会出垃圾,你想要训练一个高水平的神经网络,就得确保只使用高水平的素材。至于现实情境公不公平并不重要,重要的是不要污染我的素材库,总结一句话就是:标准会变成习惯,习惯会变成结果。

    如果你做的和别人一样,你只能期待和别人一样的结果,如果想要不同的结果,就必须提高标准。

    平庸的人会因为各种原因减低标准,环境有力就全力以赴,环境不友好就松懈下来,觉得尽力就好,这样久而久之,你的神经网络就会被污染。

    你必须确保自己交付的每一个作品,都是你所能做到最好的。

    要实行高标准,那就要明白最好的是什么才行,一个好办法就是借用榜样的力量。榜样的作用就是逼你实行高标准。

    程序大师不接受难看的代码,沟通大师不接受未经深思熟虑的电子邮件,榜样不是让你追星用的,他们让你不舒服、如芒在背才好,被大师骂是最幸运的学习经历。

    如果你没有榜样,没有大师给你反馈,那么不好意思,你的神经网络还没搭建,等你先搭建起来再往后看吧。

    4.23世界读书日

    往往我们需要训练4个神经网络。

    自我认识(self-knowledge):你得知道你自己会做什么、不会做什么,你的长处和短处,你知道的以及所不知道的,总结来说,就是你得知道你的能力边界在哪里,你不能什么都想做,也不要跟别人玩别人擅长而你不擅长的游戏。

    自控(self-control):驾驭自己的情绪和弱点。一个好的思路就是把情绪与自己拉开距离,就好像观察外在的事物一样对待它们。

    自信:(self-confidence):相信自己有能力,相信自己有价值。真正的自信一定是从做成一件件小事中得来的,如果你曾经做成了很多事情,不管别人怎么轻视你,你都可以无所畏惧,大可用一句:不知者不畏,打发了他。

    自信的人会乐于改变自己的观点,会灵活根据实际情况做出调整和改变,不会拘泥于某些细枝末节,自信总是能够给我们带来不可名状的能量和勇气。

    自信能让你专注做正确的事,而不是做正确的人,自信是面对现实的勇气,也是成就自己的基石。

    自我问责(self-accountability):这个神经网络非常强势,如果处理事件我们都能理性站在这个高度的话,没有什么问题是解决不了的。

    凯文凯利讲过一句话:成熟的基础是,即使事情不是你的错,也不意味着不是你的责任。

    在现实工作中,每个人完成工作的路径是多样的,但是没有人会关注你的过程,你所付出的努力是否有价值取决于事情最终的结果,如果结果不是正向的,你得所有努力都会显得苍白无力。

    领导在意的事结果,哪怕事情不是你的错,但也一定有你的责任,所有的解释都毫无意义,而抱怨只是在对世界应该如何运转讨价还价而已。

    而对于强人,如果我们是强人的话,我们应该专注于下一步的行动,看看做什么对未来更有利,过去已经过去了。

    从神经网络的概念去思考自己人生该如何自处,这应该是一个非常有趣的例子。当然AI不会抱怨,但抱怨是人的一种本能。

    但你要明白:当你抱怨的时候,你就是一个受害者。

    不管你处于何种原因抱怨,哪怕家人朋友都理解你的抱怨,但你依然是受害者。重点来了,我们最需要关注的是,避免自己把自己训练成长期受害者,你会有无助感和无力感,乃至绝望。

    没有成功人士愿意和一个长期受害者共事,强人不做受害者,不管是谁的错,这就是我的责任,我接受现实,我只关注下一步该怎么办。

    而你要做的,就是确保你做的每一件事,都是在训练自己的神经网络,好好去选择你做的事。

    相关文章

      网友评论

          本文标题:4.23世界读书日:如何像训练AI一样训练自己?

          本文链接:https://www.haomeiwen.com/subject/knkixjtx.html