我们可能听说和接触过很多的心理测验,有很多是玩玩的,也有很多是经过很长一段时间的研究编制出来的,那么它们真的能测量出人的心理吗?
很难,但一定程度确实可以。
首先说一说那些趣味心理测量,这些本来就是带有玩乐性质,大家也都不太当真,而且鱼龙混杂。
相对来讲有点依据的,可能要属某互联网大厂经常在年末搞的趣味测试,他们会基于一些心理学理论,加上自己所独有的数据,来编制量表,这些量表就基本可以说是比较接近于正式的心理测量了。
那么,那些正式的心理量表都是怎么搞出来的呢?
我在读研究生期间,就是搞这种心理量表的,今天让大家看一看,你所做的那些心理测量是怎么来的,到底真的可以测量出我们的心理状况吗?
你会发现,心理量表都有一个特点,就是他的每一道题目,都是在描述人的一个行为或者是态度,也就是描述一个人是怎么做的、怎么想的。
而填表的人,就去回答自己和这个描述在多大程度上符合,打个分,一般有5点评分、7点评分等等,反正都是奇数,一般5点评分最多见。
五点评分的方式,那么中间就有3分,就代表模棱两可、模糊的、不确定的状态,然后往前就是不符合,往后就是符合,只是还有两个等级而已,是帮助人们好评判的。
为什么要这么搞呢?
因为不管是什么样的心理,都有外在的表现:比如会做什么、遇事会有什么反应、和人打交道是什么方式、情绪反应是什么样的、感受是什么样的、心里的想法、有什么身体表现,等等。
你看,人的内心世界目前是没有任何工具可以去探知的,而心理量表就是通过一个人能感知到的自己怎么做、怎么想、怎么感觉来判断人的心理状态。
比如,测量一个人的抑郁水平怎么样,量表中的描述就比如“我感觉我对他人或社会有很大的价值”(这是一种情感体验);“近一周,我做事犹豫不决。”(这是做事的状态);“近一周我的食欲很好”,等等。
那么这种量表是怎么编出来的呢?如果是比较正式的心理量表,从开始编制到正式使用,没有个三五年恐怕出不来。
第一,对于一个要测量的对象,我们经常叫“心理变量”,会找人进行详细地访谈。
你要测量人们的某种心理,比如焦虑、抑郁或者别人的心理变量,你总得看看人们在这个上面,一些实际的行为或者感受,这个都要跟访谈对象详细地聊,这个过程就是要放开了说。
比如,你要调查普通大众的抑郁水平,那么你得和一些抑郁症患者聊。
这些抑郁症患者是怎么诊断出来的呢?是靠经验丰富的医生或治疗来判断的。
这也牵扯到为什么要做“标准心理量表”?
因为毕竟经验丰富、水平又高的心理医生或咨询师是非常少的,大家总不能都去找这些专家去评估自己抑郁症严不严重吧?那得把专家给累死。
既然如此,那就搞一个“标准测量”,让一些普通的咨询师或心理医生,也可以通过让来访者做一个标准量表,比较准确的判断他们的情况,起码不至于误判。
这就是心理量表之所以出现的原因。
当然, 后来慢慢就演变出了很多让普通人都能测的量表,就比如抑郁就是有“自测量表”的。
说回来,那么你找到了一些被专家评估为轻度抑郁、中度抑郁和重度抑郁的患者,以及一些正常人,来进行访谈,你就可以发现并记录他们在行为上、心态上、感受上的不同表现,比如重度抑郁症就会体验到“生活是完全没有希望的”、“对人完全失去了兴趣”等等。
从访谈当中得到的信息,很多都会被纳入到量表的题目当中。
但这这一步之前,还需要进行一个问卷来进一步收集信息。为什么呢?因为访谈只是比较深度,但是没有广度,也就是你不可能找非常多的人来聊,哪有那么多的时间。
于是,在访谈基本完成以后,就会编制调查问卷。问卷里面会会包含访谈里收集的一些信息。但是问卷的调查我就可以知道,有多少人是有这样的情况。访谈的人数毕竟比较少,免得出现以偏概全的情况,你得照顾到大部分的群体吧。
所以,当问卷基本确定了群体内普遍性的东西以后,就可以开始编心理量表了。
编心理量表的过程,可以说是一番心理大战。
我每编出一个题目,就会想两个问题:
第一,填表的人看到这样的描述,他们的理解和我要表达的是一样的吗?
第二,这个题目,他这次看,过了一段时间看理解是一样的吗?
我在编题目的时候,都会仔细去体会这两点,所以我编的量表,每个量表的信度、效度都是通过的。
什么是信度和效度呢?
信度就是稳定性,就是你今天填量表,看题目是这样子的一个理解;过了一段时间,再去填,理解就不一样了。那可不行。
那让我们相信哪一次的理解呢?所以信度低的不行。
效度呢就是有效性。就是你编的题目确实反映了你要测的对象,比如你是测抑郁的,你的题目不能和测焦虑给混淆了,或者编着编着就去测其他东西去了,这就更加不行了。
所以编题目的时候,会牢牢把握我要测量的心理变量,不能偏差。
但这个过程,全靠自己对要研究的那个心理变量(比如说抑郁)有一个深刻、直观的理解,才能时时地去监督和控制不出差错。
当然,量表真正的挑战(起码对于我)不是信效度,而是建模。这个过程可能得反复好几次,而且需要比较大的样本量。
也就是说,需要好多人去帮你填量表,才够得上建模所需的数据量(维度和题目越多需要的样本量也越多),耗时耗力,而且还可能返工。
建模很复杂而且基本使用建模软件(如AMOS)来计算的,我大概讲一下建模是什么东西。
我们编量表的时候,因为心理变量通常都比较复杂,所以会包含很多个层面,我们称之为“维度”,每个维度下面会设置若干个题目。当然也有仅一个维度的量表,比如最著名的就是自尊水平的量表,总共就10个题目,一个维度,但是却被应用很广效果也很好。
比如,我们测量儿童注意力的时候,会设置注意力稳定性、抑制控制力、任务执行、能力发展等几个维度。
这几个维度合起来,共同去说明和解释“儿童注意力”这个心理变量;相应的,每个维度下面的题目也是,他们合起来要能够解释对应的那个维度。
那么,达到上面说的这样一个状态,是要有数据来支持的。这就是建模要去证明的。
如果部分数据不支持,没达到要求,就可能需要删维度,删题目了,比如可能这个题目并不能说明这个维度,那么这个题目就是废掉的,得重新调整以后再做一遍。
时间都是耗费在这里的。但这个过程又是必须得,你不做好,这个量表就是不可信的。
如果有幸闯过了建模这个阶段,那么如果要大规模使用,就要去建立常模。
也就是填表的人做出来会有一个分数,那么这个分数你是要给他一个解释的,不然使用的人也不知道,自测的普通人就更加不知道怎么办了。
但是这个不同分数段的解释不能太主观去写,得看看全国或者某个区域里面的人,大家整体的水平是怎么样的,比如全杭州的人的抑郁水平是怎么样的,你这样一个分数段是处在什么水平。
这个过程难在需要有大量的人来填,工作量主要在这里,当然还有很多其他的工作。
总体来讲,正式的心理测量的量表是通过严格的步骤编制的,也许很难完全科学化,但是人的心理可能是目前最复杂的研究对象了,所以经过多年科学、标准的方式编制的量表还是可信的。
这些量表可以帮助专业人士做出判断,辅助或是防止误判;个人一般没特别的必要去测量,但确实可以帮助了解自己,毕竟能够通过自己的力量了解自己,可以让自己活得更好。
网友评论