string(3874) "
<p>天天刷书,一起成长。我们今天继续看王烁的《三十天认知训练营第二季》,这讲的标题是《选择:反馈最后会把你带到陷阱》。</p>
<p>英国哲学家塞亚伯林有个比方,说有两种人,一种是刺猬,一种是狐狸。</p>
<p>刺猬只知道一件大事,就一直做这一件事。</p>
<p>狐狸知道很多小事,就会不断地试。</p>
<p>知道大事的刺猬,大部分都是错误的。</p>
<p>总是不断探索小事一点一点前进的狐狸,可能会获得最终的胜利。</p>
<p>王烁说,狐狸的胜利在于它在尝试,并通过反馈的结果,不断地更换选择。</p>
<p>反馈在很多的学习方法中,都是重要的一环,比如刻意练习。</p>
<p>从反馈角度来讲,可以有三种学习方法。</p>
<h1>1// 通过什么来反馈</h1>
<p>想要反馈,先要知道试什么途径来获得反馈。</p>
<p>第一种,就是从自己的经验反馈中学习。</p>
<p>摸石头过河,就是从自己的经验反馈。</p>
<p>每件事做完,对的,就继续;错了,就换赛道。</p>
<p>这个反馈最直接,有点像计算机里的算法。</p>
<p>第二种,模仿别人。</p>
<p>找个对标的对象,他怎么做,我就怎么做,copy不走样。</p>
<p>甚至有些不知道目的的动作也做,因为也不知道到底哪个动作有用。</p>
<p>第三种,进化算法。</p>
<p><b>进化算法就是模拟自然界的套套逻辑(tautology):适者才能生存,而生存下来的就是适者。自然界就在循环论证。</b></p>
<p>当然进化中也有没用的部分,但如果不影响生存,可以完全不care他。</p>
<p>三种方法都重视反馈,根据反馈调整行为,本质上都属于适应性学习。</p>
<p>但王烁给我们警告,<b>重视反馈要有限度,狐狸也会碰到陷阱</b>。</p>
<h1>2// 反馈的陷阱在哪里</h1>
<p>反馈的陷阱在于短视。</p>
<p>我们接受的反馈,都是最直接的结果,而不是很久以后的反馈。</p>
<p>而且,很多学习方法认为,反馈就要及时。</p>
<p>但这种及时就造成了,我们看不到当下行为对长远的影响。</p>
<p>赢了当下,可能输了未来。</p>
<p>除了时间,还有一个方面,就是范围。</p>
<p>我们会更关注局部,但局部最优未必是整体最优。</p>
<p>有时候局部优化会牺牲整体利益。</p>
<p><b>适应性学习带来两大陋习,一个是为了眼前得失牺牲将来,另一个是不肯为了全局牺牲局部。</b></p>
<h1>3// 那该怎么办</h1>
<p>方法是,去搭刺猬的车。</p>
<p>狐狸和刺猬相比,是短视的,时间上短视,范围上短视。</p>
<p>但刺猬有长远计划,他认准了一件大事,会跨越时间和空间地坚持。</p>
<p>狐狸是一群精致的利己主义者,最后都会掉入陷阱,没有出路,所以要搭配刺猬长远计划的优点。</p>
<p>但刺猬的成功率非常低,一堆刺猬可能只有一只选择的方向是对的。</p>
<p>那怎么管理刺猬呢?</p>
<blockquote>
<p>能做的是试点。做大事之前先试点,低投入,隔离影响。低投入,所以失败不会有灾难性后果;隔离影响,所以失败的后果不会传染全身。</p></blockquote>
<p>然而,王烁告诫我们,这样做问题并没有消失,只是推到了下一个环节:当试点产生经验,需要推广开来时,它会面临着那堵将特区与整体隔开来的高墙,真正的冲突在那里等着它。</p>
<p>其实这是个无解的题,我们只能是找方法做的更好,但逃脱不了最后的命运。</p>
<p>想要现在好,还想要未来好,哪有那么多的好事。</p><hr>
<p>以上就是今天刷书的主要内容,希望对你有所帮助。</p>
<p>天天刷书,一起成长,明天见。</p>"
反馈:能让你的学习效果更好,也能把你带到沟里
美文网首页忘忧社我的日更计划读书
反馈:能让你的学习效果更好,也能把你带到沟里

反馈:能让你的学习效果更好,也能把你带到沟里

作者: 海涛笔记 | 来源:发表于2020-07-14 22:46 被阅读0次

    天天刷书,一起成长。我们今天继续看王烁的《三十天认知训练营第二季》,这讲的标题是《选择:反馈最后会把你带到陷阱》。

    英国哲学家塞亚伯林有个比方,说有两种人,一种是刺猬,一种是狐狸。

    刺猬只知道一件大事,就一直做这一件事。

    狐狸知道很多小事,就会不断地试。

    知道大事的刺猬,大部分都是错误的。

    总是不断探索小事一点一点前进的狐狸,可能会获得最终的胜利。

    王烁说,狐狸的胜利在于它在尝试,并通过反馈的结果,不断地更换选择。

    反馈在很多的学习方法中,都是重要的一环,比如刻意练习。

    从反馈角度来讲,可以有三种学习方法。

    1// 通过什么来反馈

    想要反馈,先要知道试什么途径来获得反馈。

    第一种,就是从自己的经验反馈中学习。

    摸石头过河,就是从自己的经验反馈。

    每件事做完,对的,就继续;错了,就换赛道。

    这个反馈最直接,有点像计算机里的算法。

    第二种,模仿别人。

    找个对标的对象,他怎么做,我就怎么做,copy不走样。

    甚至有些不知道目的的动作也做,因为也不知道到底哪个动作有用。

    第三种,进化算法。

    进化算法就是模拟自然界的套套逻辑(tautology):适者才能生存,而生存下来的就是适者。自然界就在循环论证。

    当然进化中也有没用的部分,但如果不影响生存,可以完全不care他。

    三种方法都重视反馈,根据反馈调整行为,本质上都属于适应性学习。

    但王烁给我们警告,重视反馈要有限度,狐狸也会碰到陷阱

    2// 反馈的陷阱在哪里

    反馈的陷阱在于短视。

    我们接受的反馈,都是最直接的结果,而不是很久以后的反馈。

    而且,很多学习方法认为,反馈就要及时。

    但这种及时就造成了,我们看不到当下行为对长远的影响。

    赢了当下,可能输了未来。

    除了时间,还有一个方面,就是范围。

    我们会更关注局部,但局部最优未必是整体最优。

    有时候局部优化会牺牲整体利益。

    适应性学习带来两大陋习,一个是为了眼前得失牺牲将来,另一个是不肯为了全局牺牲局部。

    3// 那该怎么办

    方法是,去搭刺猬的车。

    狐狸和刺猬相比,是短视的,时间上短视,范围上短视。

    但刺猬有长远计划,他认准了一件大事,会跨越时间和空间地坚持。

    狐狸是一群精致的利己主义者,最后都会掉入陷阱,没有出路,所以要搭配刺猬长远计划的优点。

    但刺猬的成功率非常低,一堆刺猬可能只有一只选择的方向是对的。

    那怎么管理刺猬呢?

    能做的是试点。做大事之前先试点,低投入,隔离影响。低投入,所以失败不会有灾难性后果;隔离影响,所以失败的后果不会传染全身。

    然而,王烁告诫我们,这样做问题并没有消失,只是推到了下一个环节:当试点产生经验,需要推广开来时,它会面临着那堵将特区与整体隔开来的高墙,真正的冲突在那里等着它。

    其实这是个无解的题,我们只能是找方法做的更好,但逃脱不了最后的命运。

    想要现在好,还想要未来好,哪有那么多的好事。


    以上就是今天刷书的主要内容,希望对你有所帮助。

    天天刷书,一起成长,明天见。

    相关文章

      网友评论

        本文标题:反馈:能让你的学习效果更好,也能把你带到沟里

        本文链接:https://www.haomeiwen.com/subject/ljyqhktx.html