(文 刘俊芳)
五、面向表现的评估设计中常见的困惑是什么?证据与预期结果什么时候会出现不匹配?
在面向表现的评估设计中存在一个常见的困惑,许多教学设计师们将有趣的学习活动和恰当的表现证据混为一谈,因为表现是复杂的,任务是有趣的,所以从学生作品中获得的证据与预期结果是不匹配的。
六、有趣的项目、真实的活动、有效的评估三者的区别与联系是什么?
我认为有趣的项目是任务的表现形式,真实的活动是任务的学习内容,有效的评估是基于标准的评估方式,用来判断既定目标的达成度。
七、如何避免评估证据效度不高的问题?
从目标中衍生出通用指标是很重要的。如果老师在设计具体的立体模型任务之前,已经考虑好与标准相关的合适指标,就可能避免评估效度不高的问题。
八、效度与什么有关?
效度与推理有关,与测试本身无关,效度关注证据的含义。我们要求学生做什么?我们怎样评估任务的结果?换句话说,消毒是我们对结果的理解,而不是测试本身。
效度也影响着量规的设计,效度问题来自于量规,而不是任务。我们必须确保采用了正确判断理解(或者其他目标的指标),而不仅仅是看什么指标容易判断得分,就采用什么。
九、关于理解的评估的八个问题和指导原则是什么?
1.与从客观测试中获得的评估知识和技能的证据相比,关于理解的评估所需的证据要更见解,更复杂。我们需要观察的不仅仅是正确答案的百分比。为什么?有时正确答案的获得来自于死记硬背、良好的测试技巧或好运气,在用于理解的评估中,我们需要深挖答案背后的原因和学习者做出这种选择的意图。
2.关于理解的评估需要收集在表现或产品中进行“应用”的证据,但这会使评判结果变得复杂。当我们发现学生对学习内容有深切的领悟,但对部分复杂任务的表现不稳定时怎么办?或者当我们发现学生的学习结果很好,但他们在完成项目的过程中缺乏洞察力时怎么办?我们应该如何设计表现,以使我们可以准确的从不同方面来评判表现?
3.既然理解包含六侧面,那么是不是有些方面优于另外一些方面呢?哪个表现更相关,又是在什么情况下相关呢?比如,当所采用策略的“应用”和“解释”功能很强,但对情境的“阐明”功能很弱时,我们可以从中推断出什么呢?或者虽然个别“应用“没有效果,但从口头汇报和自我评估中,我们清楚的获知学习者对内容和过程有可靠的理解,这又该如何处理呢?
4.尝试对相同内容同时使用不同的测试形式。换句话说,在面对相同内容时,同时使用简单小测试和复杂任务“困境”或者使用构答题来展示同样的内容,从而确保学生的答案反映了他们的理解。尽可能使用不同形式的并行的评估方式来提高指向预期结果的证据质量。
5.试着去预测关键误解,并且使用简单的前测和后测来确定这些误解是否被克服。
6.考虑到某个应用或产品可能与更大的目标相关或不相关,一般会要求学生“展示他们的作品”,针对他们的答案给出解释,并且展示答案中那些与主要原则或概念相关联的内容。
7.假定学生在解释时表达清晰,可能更多是得益于他的语言表达能力,而非来自真正的理解。在这种情况下,可以要求学生将解释“转化”为一个新的或者不同的问题、情景或事件。
8.利用不同侧面来扩充整机,但要求学生动手操作(侧面3)时,同时要求其阐明(侧面2)和自评(侧面6),以此来确保不会高估最终产品。在很多时候都可以结合洞察和神入两个层面的要求。
网友评论