王烁的30天认知训练营中提到反馈的三种学习方法。
第一种方法是从自己的经验中学习。
过去做什么以及怎样做获得成功,将来就会更多地用同样方法做同样的事,反之则减少。从得失中学习是最朴素的学习机制,每个人天生就趋利避害。
博弈论研究也支持这个学习策略,赢就接着来,输就换个招。 你不用观察对方是什么策略,你只要看自己的得失,赢就继续输就换,简洁到人人无师自通。
第二种方法是模仿。
别人怎么成功,就学习他的成功经验,哪怕是想象出来的成功经验,也常常有用。所谓摸着石头过河,自己去摸很重要,但更重要的是有个现成的方向可以摸过去。
模仿最有意思的地方是由表及里,从外在成功倒推内在的成功机理,先回溯,再模仿。其实并不存在万能方法判定解剖到了哪一层,就真正管用。
模仿是本能。婴幼儿主要就是通过模仿来学习。所谓的身教要胜于言传,也是这个道理。
第三种方法是进化算法。
物竞天择,适者生存。适应性越高的越能活下来,有越多的后代,扩散开去。至于适应性高的原因是什么,不是很重要。天地不仁,以万物为刍狗,刍狗不必要了解天地的想法,本来就了解不到,了解到了搞不好吓自己一跳。
人之所以是今天这个样子,不是因为哪只黑猩猩做了伟大计划要站起来,而是适应的就活下来开枝散叶,几百万年一代代重复,才变成今天这个样子。倒回去看进程,有无数种其他可能性倒毙在半路。现实的就是合理的,合理的就是现实的。 进化算法就是模拟自然界的套套逻辑(tautology):适者才能生存,而生存下来的就是适者。自然界就在循环论证。
在全社会的层面上,天然采用着进化算法。无数种观念和行为彼此竞争,适应者留下来,传开去。
从自己的经验中学习,从模仿他人中学习,使用进化算法模拟学习。三种方法都重视反馈,根据反馈调整行为,本质上都属于适应性学习,都很有用,但是:重视反馈要有限度。
网友评论