从小白开始学心理学
条件反射
心理学中十分经典的实验是来自巴甫洛夫的“经典条件反射”,通过对狗进行非条件刺激、条件刺激+非条件刺激、条件刺激的三组实验,得到了巴甫洛夫条件反射(经典条件反射)。
经典条件反射(classical conditioned response):一种学习形式,在这种学习形式中,一种刺激获得了可以激发一种原本由其他刺激所引发的能力。
非条件反射可能是天生的,可能是后天习得的,在经典条件反射中,条件反射就是基于非条件反射形成的一个新的反射路径。在非条件反射的过程中,同时施加条件反射和非条件反射,形成一个新的回路,条件反射=>对应刺激。最后,撤掉非条件刺激,就形成了一个完整的条件反射过程。
条件反射一般经历:习得、消退、恢复、刺激泛化和刺激分化,这四个过程。习得就是条件反射形成的过程;消退是在一段时间之后,条件反射会慢慢失效,甚至是消失。恢复,具体是指在特定的“环境”刺激之下会恢复原来的“条件反射”。在生活中,会有一些不时发现,自己会在一些特定的场景之下做出自己意想不到,但是有时自己很熟悉的行为,这个就是“恢复”的最佳体现。
刺激的泛化和分化是两个相反的过程,泛化更像是对已经形成的“条件反射”的拓展,分化这是把“条件反射”具体化。泛化的就像是一个早起习惯能够在任何地方发生,不会太受到环境的影响。分化这是例如特定的动作只有在特定的场景中会发生。形成了一个强烈且清晰的刺激—回应的路径。
操作性条件反射
上面介绍的条件反射并不像“学习”,而现在要说的操作性条件反射更像是我们学习的过程(正常人的学习过程)。
操作性条件反射(operamt conditioning):是一种反应被它所带来的结果所控制的学习模式。
结果导向(result-oriented)
这个定义和“结果导向”这个概念有相似之处,这里特指的是学习,而结果导向,描述的是一种处理事务的模式。
用大白话来说:“你知道结果会是怎么样,所以你会采取对应的行动。”
希望这个足够让你理解操作性条件反射是什么,目前来说,很多自发的行为,多是这样的操作性条件反射。例如学习末项技能,你能清楚的知道在学习之后能用这个技能来完成什么事情,或者是加薪……有一个目标,完成目标会得到对应的结果。
操作性条件反射会经历:获得、消退、刺激控制(泛化和分化),这三个过程。与经典条件反射相似。不同点有:1、消退的过程会出现消退阻力(resistance to extinction),基于结果形成的行动会因为结果的改变而阻碍行为的消退。2、强化物的作用。
<figure class="md-table-fig" contenteditable="false" cid="n33" mdtype="table" style="box-sizing: border-box; margin: -8px 0px 0px -8px; overflow-x: auto; max-width: calc(100% + 16px); padding: 8px; caret-color: rgb(51, 51, 51); color: rgb(51, 51, 51); font-family: "Open Sans", "Clear Sans", "Helvetica Neue", Helvetica, Arial, sans-serif; font-size: 22px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: pre-wrap; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255); text-decoration: none;">
过程与定义 | 经典条件反射的描述 | 操作性条件反射的描述 |
---|---|---|
获得 | 条件刺激与非条件刺激配对,逐渐形成条件反射 | 反应因为强化物的出现逐渐增加,可能经历塑造 |
消退 | 条件刺激单独出现,直到不引起条件反射 | 在强化物停止呈现后,反应逐渐减慢、停止 |
刺激泛化:机体对此类原始刺激之外的其他刺激的反应 | 条件反射被其他类似于原始条件刺激的新刺激引起 | 反应在与原始刺激类似的新刺激出现时也会增加 |
刺激分化:机体对与原始刺激相似的刺激缺少反应 | 条件反射不被与原始刺激类似的刺激引发 | 反应不会在与原始刺激类似的刺激出现时增加 |
</figure>
强化物(敲黑板)
强化(reinforce):为其后果能够增加机体反应倾向。(不懂,是很正常的,因为我也不懂)
强化物,这个词不能很好理解,换个说法——反馈。这个反馈可以是正向的(美食、旅行……)也可以是负向的(撤掉你得到美食的机会……)强化物是反馈的具体体现。反馈是强化物的作用过程,初级强化物是人们的刚需(吃喝拉撒),次级强化物是指金钱、好成绩、注意力等。
强化物的作用有三类:正强化、负强化、惩罚。
<figure class="md-table-fig" contenteditable="false" cid="n62" mdtype="table" style="box-sizing: border-box; margin: -8px 0px 0px -8px; overflow-x: auto; max-width: calc(100% + 16px); padding: 8px; caret-color: rgb(51, 51, 51); color: rgb(51, 51, 51); font-family: "Open Sans", "Clear Sans", "Helvetica Neue", Helvetica, Arial, sans-serif; font-size: 22px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: pre-wrap; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255); text-decoration: none;">
行为之后的反应与结果 | |
---|---|
正强化 | 得到奖励 |
负强化 | 惩罚撤销 |
惩罚 | 惩罚执行 |
</figure>
我对惊喜的定义有两个:一个是意料之外的好事发生了,另一个是意料之外的坏事没有发生。
负强化的定义,与我对惊喜的第二个定义类似,少了“意料之外”。
观察学习
在两种条件反射之后,还有一种学习方式,其实就是模仿。通过看到别人做到,特别是身边的人做到,对能做到的事情有了更深的信心和正向反馈。像是朋友考研成功了,那我考研成果的概率也会高很多,所以说学霸都是结伴的。
拓展:观察学习和镜像神经元有什么关系呢?
今日得到:
学习的过程是可以拆解的,一个学习任务可能是由这三种或者更多的方式组合形成的。其中强化物的选择和作用是一个很好的工具。在游戏的机制中就有类似的设定——“随机奖励”,这就是一个很好的强化物,而且只有正强化的作用,让你不断的在正强化的刺激下继续游戏。从这个角度来解释上瘾机制就能清晰地看到,条件反射可以是自发的(操作性条件反射),也可以是“自发”的(经典条件反射)。
这不仅仅是学习,也还是很好的习惯养成的方式,形成一个新的条件反射回路,也就是一个新的习惯。
想要学习的轻松,这个需要天赋,但是想要学的开心,是有办法的,找对学习的模式,嵌入到一有的习惯中,选择合适的强化物(金钱或者是关注度),持续在反射过程中得到正反馈。
参考文献:
心理学导论,第九版,Wayne Weiten著,高定国等译
网友评论