一、《筑基笔记八十五1》王婷灏,中原焦点团队讲师、心理咨询师,持续原创分享第1865天,2024年1月7日
第三节 测验的信度
第一单元信度的概念
信度的定义
信度是指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。
信度只受随机误差(随机效应) 的影响。
例:秤东西时手抖了
第 二 单 元 信 度 (可信任的程 度) 评 估 的 方 法
一、重测信度 (test-retest reliabllity)
使用同一测验,在同样条件下对同一组被试者前后 施测两次测验,求两次得分间的相关系数,叫重测信 度,又称稳定性系数。
人的多数心理特征如智力、性格、兴趣等,具有相 对的稳定性,间隔一段时间,不会有很大变化。
重测就是重新测
优点:提供有关测验是否随时间变化的资料
缺点:易受练习和记忆的影响
多一般是两周到四周较宜,间隔时间最好不超过六个月。
二、复本信度(alternate-form liability)
多以两个等值但题目不同的测验(复本)来测量同一群
体,然后求得被试者在两个测验上得分的相关系数 复本信度反映的是测验在内容上的等值性,故又称
等值性系数。
“复本”即“复印本”
如果两个复本的施测相隔一段时间,则称重测复本信度或稳定与等值系数。
优点:避免重测信度的一些问题(记忆、学习效应等)
复本信度局限性:
其一,如果测量的行为易受练习的影响,则复本信度只能
减少而不能完全消除这种影响;
其二,由于第二个测验只改变了题目的内容,已经掌握的 解题原则,可以很容易地迁移到同类问题。
最后,对于许多测验来说,建立复本是十分困难的。
三、 内部一致性信度
(一)分半信度(split-half reliability)
通常是在测验实施后将测验按奇、偶数分为等值的 两半,并分别计算每位被试在两半测验上的得分,
求出这两半分数的相关系数。这个相关系数就代表 了两半测验内容取样的一致程度。
分半信度往往会低估信度。
(二)同质性信度
代表测验内部所有题目间的一致性。
各题目得分有较高正相关时,测验是同质的;即使 所有题目看起来好像测量同一特质,但相关很低或 为负相关时,则测验为异质的。
“同质”即“共同质量”。
四、 评分者信度
随机抽取若干份测验卷,由两位评分者按评分标准 分别给分,然后再根据每份测验卷的两个分数计算 相关,即得评分者信度。
一般要求在成对的受过训练的评分者之间平均 一致性达0.90以上,才认为评分是客观的。
实际上有多少误差的来源,便有多少估计信度的方法。
第三单元影响信度的因素
分数分布范围越大,相关越高,信度越高。
一、样本特征
(一)样本团体异质性的影响
一般而言,若获得信度的取样团体较为异质的话,往往 会高估测验的信度,相反则会低估测验的信度。
(二)样本团体平均能力水平的影响
对于不同水平的团体,题目具有不同的难度,每 个题目在难度上的微小差异累计起来便会影响信度。
二、测验长度
一般来说,在一个测验中增加同质的题目,可以便信度提高。
第一,测验越长,测验的测题取样或内容取样就越有
代表性。
第二,测验越长,被试的猜测因素影响就越小。
增加测验长度的效果应遵循报酬递减率原则有时反而会引起被试的疲劳和反感而降低可靠性。
三、 测验难度
难度太大或太小,使得分数范围缩小,信度会降低。
平均难度0.5,信度最大。
四、 时间间隔
以再测法或复本法求信度,两次测验相隔时间越短,其
信度系数越大;
专栏:韦氏成人智力量表WAIS
言语量表——言语智商VIQ
操作量表——操作智商PIQ
总量表—一总智商FIQ
二、持续每日阅读1438天《心理学基础》。有声读书打卡第1308天。
三、讲师班开讲第1417天,心理咨询师爸爸的育儿手记。给孩子最好的礼物。
四、咨询638次。
网友评论