#读书笔记#《和“伪心理学”说不》DAY3 GTD-2007-大禹-云南
个案研究可能带来偏见,所以科学心理学从来不以见证或个案来作为研究的证据。如何设计一个合理的心理学实验并从中推出合理的结论呢?
相关与因果
按照操作主义的观点,我们在对一个理论的真伪进行验证的时候,就必须用变量来取代概念,用研究假设来取代逻辑关系。而对变量关系作出的最普遍的研究假设就是“相关”。相关就是相随变动的关系,在我们的生活中十分常见,比如学业自我效能感与学业成就之间的正相关、抑郁与心理健康之间的负相关等等。但需要注意的是,相关仅仅是相关,统计学上的相关并不意味着有实际意义,在作出推论时更要慎之又慎。
某沿海地区开展了一次大规模调研,考察溺水事故的可能原因。其中有一个研究团队的调查结果很有意思:该地区的溺水死亡人数和冰激淋的销售量呈现出强烈的正相关。原来,溺亡人数和冰激淋销售量之间存在着“虚假相关”,即这两个变量是通过了“第三方”的变量联系起来。这个“第三方”可能会是季节或是气温:夏天来临,气温升高,冰激淋的销售量会增加;同时天气较热时会有更多人去海边戏水解暑,夏天正是溺水事故多发的季节。看来,这才可能是溺亡人数和冰激淋销售量相关关系的内部机制。所以,无论二者的相关关系有多强烈,我们都不能说它们之间存在因果关系。
人类是非理性的动物,常常把相关关系误认为因果关系。而且并不是所有的漏洞都像上面的例子一样显而易见。我们接下来将围绕第三变量问题、方向性问题和选择性偏见进行讨论,以帮助你在作出因果推论时更好地识破相关证据的局限性。
文中举例:哈佛大学的一个心理学实验--关于提高车间照明能否提升工人们生产效率的实验,最终得出,“提高照明度能够提升工人生产效率”的因果推论。但后来又对提高和降低照明也作了实验,最终降低也提高了工人们的生产效率。原来,真正的因素是因为工人们意识到自己正在被别人观察,所以更加努力表现自己而带来的生产效率的提升,并非与照度有关。揭示了“第三变量问题”,在第一次的研究中,研究者未能很好地操纵、控制和测量“感知到的被观察”这个第三变量,所以作出了错误的因果推论。
开展实验和调查研究,科学有效的方式和方法,是保证研究结果更接近真实的基础。
可是,有些问卷法的研究并不能直接地操纵关键变量,所以心理学家们创造了许多复杂的统计方法(偏相关、多元回归、路径分析等)来排除其他无关变量的干扰。从这个角度上来说,心理学家们也为统计学的发展作出了巨大贡献。
当代著名的心理学家阿尔伯特•班杜拉(Albert Bandura)最大的贡献之一,是他所提出的“自我效能感理论”。“自我效能感”是指个体对自己是否有能力完成某一行为所进行的推测与判断。教育心理学领域曾存在这样一种观点,高水平的自我效能感能够带来学业成就。这一假设得到了许多研究结果的支持,也为许多旨在提高自尊自信的教育政策提供了理论依据。然而,二者的方向性是确定的吗?有人提出,自我效能感和学业成就之间也有可能是一种相反的作用方向,即成绩越好的学生更会对自己完成事情的能力充满信心。目前的研究也的确证明了这一点,自我效能和学业成绩之间并不是简单的因果关系,更有可能是一种互为因果的复杂机制。
这样一个互为因果的机制对于教育来说,是非常重要的。成绩越好,对自己完成事情的能力也就越充满信心;当然,越充满信心,成绩相对于也越好。因此,对于教育的指导,是不是注重发现并支持孩子某方面的爱好、兴趣,可以提振他的信心,鼓励和不断地、不放弃的支持,也可以提振或恢复孩子的信心,对于他的成绩或者他的某方面的特长的发挥也是有积极作用的。人的内心其实是有一种力量的,积极的有:不服输、不灰心、认准了不放弃。我想也是一种自我效能感吧?
文中的另一个例子:有一位飞机维修师,通过分析战机上子弹孔的分布来为飞机改造提供建议。按照常理来说,被子弹击穿的地方,应该安装上防弹层,以保证飞机不被损坏。但如果你这样决策的话,就陷入了“选择性偏差”的圈套。因为,子弹袭击飞机各部位的可能性几乎是相等的,如果飞机能够返航接受修理,那么被击穿的部位肯定不会对飞机造成致命的伤害,而返航机上没有弹孔的地方,正是那些坠毁战机被击中的要害!如果维修师犯了“选择性偏差”的错误,那么造成的后果将会是触目惊心的。
以上三个局限性告诉我们,从相关到因果,必须要在操纵所有变量的前提下进行严密的实验。
显然,有相关不意味着有因果,相关关系只是因果关系存在的前提。但这并不是说相关关系的证据就没有价值。当我们的目标是预测而不是发现原因时,我们仅仅用到相关就足够了。随着大数据时代的来临,我们利用海量数据的相关分析,通过找到现象的关联物就足以预测未来。就如同《大数据时代》的作者维克托•迈尔-舍恩伯格(Viktor Mayer-Schönberger)所说,对于许多事情,知道“是什么”就够了,没必要知道“为什么”。
今天的书名叫《和“伪心理学”说不》,其实,在现代社会中,到处存在着“伪”的东西。如什么大数据、什么互联网+、什么互联网思维。很多人,甚至不乏决策者,经常会犯“自以为”的问题,随便拎出一个概念,大讲特讲,大搞特搞,上下一群人围着进行所谓的创新。结合着自己的本质工作,就大数据和数据应用而言,我们的很多系统,只是实现了由“写字”向“打字”的转变,实现了由本机电脑摆放向服务器摆放的转变。甚至在一个系统里面,很多本来关联的数据,但却孤立于系统的不同部位。这样的数据就是垃圾数据,无一点应用价值。这样的系统非但没有减轻人的劳动强大,反而加大了,苦不堪言。
操纵与控制
根据实验的控制程度,我们可以将实验方法分为前实验、准实验和真实验三种类型。
前实验:
前实验设计又称为非实验设计,只是进行简单的观察和比较,不主动地去操纵实验条件,更缺乏对无关干扰因素的控制,所以无法得出因果推论。前实验设计更像是一种在自然情境下的观察。
准实验
相比较于前实验设计,准实验设计的控制程度有所提高。但是,准实验设计也无法完全控制误差来源。
真实验
相对于前实验和准实验的实验方法,真实验方法可以为因果关系的证明提供证据,因为它对研究过程的要求最高。被试(实验对象)的随机分配和自变量的直接操纵必须同时满足,才算得上是一个真实验设计。
通过一个例子来加以说明:假设需要研究喝咖啡对人们集中注意力的影响,我们可以招募20名大学生志愿者参与实验,并把这些被试随机分配到两个组。随机分组并不是随意分组,而是根据统计推论的原理,使每个实验对象分配到不同实验处理组的机会相同。随机分组能够避免实验者主观因素的参与,并且尽可能地控制意想不到的无关因素带来的实验误差。
接下来是对自变量的操纵,让实验组的被试喝200毫升的咖啡,对照组的被试喝等量的纯净水。直接操纵自变量能让我们产生更具有说服力的推论,实验组和对照组除了被操纵的自变量之外其他变量均保持不变,为我们排除了因变量受其他无关因素影响的可能性。
网友评论