string(3874) " 天天刷书，一起成长。我们今天继续看王烁的《三十天认知训练营第二季》，这讲的标题是《选择：反馈最后会把你带到陷阱》。 英国哲学家塞亚伯林有个比方，说有两种人，一种是刺猬，一种是狐狸。 刺猬只知道一件大事，就一直做这一件事。 狐狸知道很多小事，就会不断地试。 知道大事的刺猬，大部分都是错误的。 总是不断探索小事一点一点前进的狐狸，可能会获得最终的胜利。 王烁说，狐狸的胜利在于它在尝试，并通过反馈的结果，不断地更换选择。 反馈在很多的学习方法中，都是重要的一环，比如刻意练习。 从反馈角度来讲，可以有三种学习方法。 <h1>1// 通过什么来反馈</h1> 想要反馈，先要知道试什么途径来获得反馈。 第一种，就是从自己的经验反馈中学习。 摸石头过河，就是从自己的经验反馈。 每件事做完，对的，就继续；错了，就换赛道。 这个反馈最直接，有点像计算机里的算法。 第二种，模仿别人。 找个对标的对象，他怎么做，我就怎么做，copy不走样。 甚至有些不知道目的的动作也做，因为也不知道到底哪个动作有用。 第三种，进化算法。 进化算法就是模拟自然界的套套逻辑（tautology）：适者才能生存，而生存下来的就是适者。自然界就在循环论证。 当然进化中也有没用的部分，但如果不影响生存，可以完全不care他。 三种方法都重视反馈，根据反馈调整行为，本质上都属于适应性学习。 但王烁给我们警告，重视反馈要有限度，狐狸也会碰到陷阱。 <h1>2// 反馈的陷阱在哪里</h1> 反馈的陷阱在于短视。 我们接受的反馈，都是最直接的结果，而不是很久以后的反馈。 而且，很多学习方法认为，反馈就要及时。 但这种及时就造成了，我们看不到当下行为对长远的影响。 赢了当下，可能输了未来。 除了时间，还有一个方面，就是范围。 我们会更关注局部，但局部最优未必是整体最优。 有时候局部优化会牺牲整体利益。 适应性学习带来两大陋习，一个是为了眼前得失牺牲将来，另一个是不肯为了全局牺牲局部。 <h1>3// 那该怎么办</h1> 方法是，去搭刺猬的车。 狐狸和刺猬相比，是短视的，时间上短视，范围上短视。 但刺猬有长远计划，他认准了一件大事，会跨越时间和空间地坚持。 狐狸是一群精致的利己主义者，最后都会掉入陷阱，没有出路，所以要搭配刺猬长远计划的优点。 但刺猬的成功率非常低，一堆刺猬可能只有一只选择的方向是对的。 那怎么管理刺猬呢？ <blockquote> 能做的是试点。做大事之前先试点，低投入，隔离影响。低投入，所以失败不会有灾难性后果；隔离影响，所以失败的后果不会传染全身。</blockquote> 然而，王烁告诫我们，这样做问题并没有消失，只是推到了下一个环节：当试点产生经验，需要推广开来时，它会面临着那堵将特区与整体隔开来的高墙，真正的冲突在那里等着它。 其实这是个无解的题，我们只能是找方法做的更好，但逃脱不了最后的命运。 想要现在好，还想要未来好，哪有那么多的好事。<hr> 以上就是今天刷书的主要内容，希望对你有所帮助。 天天刷书，一起成长，明天见。"

反馈：能让你的学习效果更好，也能把你带到沟里

作者: 海涛笔记 | 来源:发表于2020-07-14 22:46 被阅读0次

天天刷书，一起成长。我们今天继续看王烁的《三十天认知训练营第二季》，这讲的标题是《选择：反馈最后会把你带到陷阱》。

英国哲学家塞亚伯林有个比方，说有两种人，一种是刺猬，一种是狐狸。

刺猬只知道一件大事，就一直做这一件事。

狐狸知道很多小事，就会不断地试。

知道大事的刺猬，大部分都是错误的。

总是不断探索小事一点一点前进的狐狸，可能会获得最终的胜利。

王烁说，狐狸的胜利在于它在尝试，并通过反馈的结果，不断地更换选择。

反馈在很多的学习方法中，都是重要的一环，比如刻意练习。

从反馈角度来讲，可以有三种学习方法。

1// 通过什么来反馈

想要反馈，先要知道试什么途径来获得反馈。

第一种，就是从自己的经验反馈中学习。

摸石头过河，就是从自己的经验反馈。

每件事做完，对的，就继续；错了，就换赛道。

这个反馈最直接，有点像计算机里的算法。

第二种，模仿别人。

找个对标的对象，他怎么做，我就怎么做，copy不走样。

甚至有些不知道目的的动作也做，因为也不知道到底哪个动作有用。

第三种，进化算法。

进化算法就是模拟自然界的套套逻辑（tautology）：适者才能生存，而生存下来的就是适者。自然界就在循环论证。

当然进化中也有没用的部分，但如果不影响生存，可以完全不care他。

三种方法都重视反馈，根据反馈调整行为，本质上都属于适应性学习。

但王烁给我们警告，重视反馈要有限度，狐狸也会碰到陷阱。

2// 反馈的陷阱在哪里

反馈的陷阱在于短视。

我们接受的反馈，都是最直接的结果，而不是很久以后的反馈。

而且，很多学习方法认为，反馈就要及时。

但这种及时就造成了，我们看不到当下行为对长远的影响。

赢了当下，可能输了未来。

除了时间，还有一个方面，就是范围。

我们会更关注局部，但局部最优未必是整体最优。

有时候局部优化会牺牲整体利益。

适应性学习带来两大陋习，一个是为了眼前得失牺牲将来，另一个是不肯为了全局牺牲局部。

3// 那该怎么办

方法是，去搭刺猬的车。

狐狸和刺猬相比，是短视的，时间上短视，范围上短视。

但刺猬有长远计划，他认准了一件大事，会跨越时间和空间地坚持。

狐狸是一群精致的利己主义者，最后都会掉入陷阱，没有出路，所以要搭配刺猬长远计划的优点。

但刺猬的成功率非常低，一堆刺猬可能只有一只选择的方向是对的。

那怎么管理刺猬呢？

能做的是试点。做大事之前先试点，低投入，隔离影响。低投入，所以失败不会有灾难性后果；隔离影响，所以失败的后果不会传染全身。

然而，王烁告诫我们，这样做问题并没有消失，只是推到了下一个环节：当试点产生经验，需要推广开来时，它会面临着那堵将特区与整体隔开来的高墙，真正的冲突在那里等着它。

其实这是个无解的题，我们只能是找方法做的更好，但逃脱不了最后的命运。

想要现在好，还想要未来好，哪有那么多的好事。

以上就是今天刷书的主要内容，希望对你有所帮助。

天天刷书，一起成长，明天见。

反馈：能让你的学习效果更好，也能把你带到沟里

1// 通过什么来反馈

2// 反馈的陷阱在哪里

3// 那该怎么办

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

忘忧社

我的日更计划

读书