教育测量与评价
1.质量特性
(1)信度:多次测验结果间的一致性程度(测量结果的稳定性)
重测信度:同一测验(量表)对同一组被试测施测两次所得结果的一致性程度。
复本信度:用两个平行测验对同一组被试所测结果的一致性程度。
同质性信度:测验内部所有题目间的一致性程度。
(2)效度:一次测验的有效程度(一个测验或量表实际能测出其所要测量的特性程度)
注意:效度始终是针对一定测量目的而言的
效度是针对测量结果而言的
评价一个测量是否有效要从多角度,多方面的搜集证据
效度只有程度上的差异
2.结构效度的验证方法
(1)测验内部寻找证据法:通过研究检测内部结构,以验证测验结构效度的方法
内容效度,作答过程分析,测验同质性,因素分析法
(2)测验之间寻找证据法:同时考察两个或多个测验之间的相互关系,以验证测验结构效度的方法
相容效度,聚合效度,区分效度,多种特质:多种方法矩阵法
(3)实证效度法:差异被试比较法,先后测试分析法
编制教育测验
1.题目类型和编写原则
(1)选择题
优点:
可用来测量学生各种不同层次的学习结果,不仅是所学知识的掌握程度,也可用来测量学生对所学知识的理解、分析、判断、应用、综合能力。类型试题应用最广泛。
评价标准客观统一,不会受评分人主观因素和被试者意想之外答案的影响,便于电脑迅速改卷,大大提高测验信度,提高评卷速度和自动化水平;
涵盖知识范围广,避免测验效度不高的问题;
有利于测验被试思维的敏捷性和准确的判断力;
采用大量似真选择项使得结果易于诊断,通过对被试错误选项选择的线索,便于教师发现、分析并及时纠正学习中存在的问题。
缺点:及时纠正
由于选择题数量多,每一个试题中除正确答案外,似真项多,并要与题干有相当逻辑关系和关联,出一道好的选择题较花费时间,要用专门命题技巧;
难以测验学生的总结能力,表达能力,写作能力,概括能力,分散思维能力等;
无法测验被试的思维过程;
被试可仅凭猜测选对答案。
编写原则:
题干,简明,意义完整能表达一个确定的问题;采用肯定语句表达(正面陈述),不能暗示正确答案;
选项,有似真项,表达精炼,避免“以上皆是/非”的答案;
统一测验中每一个题目之间独立无关联。
(2)填空题
空白处横线线段长度一致,避免起到暗示作用。空白处是关键词;题干明确,限定严密,答案唯一;位于题干中间或后面;若答案是数字,应注明单位和精确程度。
(3)简答题
问题叙述明确,确保被试用简单语言回答;
直接用问句提出问题;
答案应该唯一并且简单明确;
避免只考机械记忆的题,注重知识运用;
若考察公式,不用太多太复杂数字,避免给计算带来麻烦。
2.测验目标
(1)布鲁姆教育目标分类
认知领域:知识 领会 运用 分析 综合 评价
情感领域:接受 反应 价值评价 组织 由价值或价值复合体组成的性格化
动作技能领域:知觉 准备 指导反应 机械化 复杂反应 适应性 独创性
(2)明确测验目标
深入研究课程目标,教育目标是测验目标的依据,二者要保持一致;
依据社会要求和学科特点,选择合适的目标领域和类别,不是所有测验都要包含三个领域和所有类别;
考虑目标层次性和涵盖性,正确选择各类目标间的关系,类别排列是简单到复杂,前一类别是后一类别的基础,后一类别涵盖前一类别,较复杂行为目标含有简单行为目标。
3.设计测验考虑因素
(1)明确测验目的,测验是一种手段,不管谁测验,都有一定的目的和要求。
(2)明确测验属性,学科测验,人格测验,智力测验。
(3)明确测验性质和用途,不同用途测验的难度水平和具体的编制要求都不一样。
(4)明确测验对象,考虑被试的年龄特点,知识(教育)水平,社会文化背景。
(5)分析测验目标,首先选定测验想达到测量的教学目标,其次教育目标和陈述目标要能测量,适合测量。
4.测验的编制和组织
(1)选定测验材料
(2)编制测验命题
(3)试测和题目分析
(4)合成测验
(5)编制副本
(6)编写测验手册
网友评论