杨念鲁:科学评价引领教育质量全面提升
大家上午好!我从中国教育学会组织这次会议,以及我们会后要开展的对综合评价实验区的专业服务的角度,谈一谈我们的一些认识,我们下一步打算怎么做。
本来我有一个发言的提纲,我准备谈两个大的问题:一个就是综合质量评价改革,改什么?第二个大的问题是怎么改?
一天多的会下来,我发现第一个问题,里边有很多内容我不用再说了,因为再说也是重复,重复我们这些专家、学者的观点,无非大家从不同的校对来解释,来解读这样一些理念和观点,所以有些问题我就把它略去了。
在改什么里边,我本来是从三个方面来谈:第一个是改变观念,这个我就不说了,整个略去了,因为通过一天多的报告、研讨,大家已经很清楚我们这个基础教育综合质量评价改革到底改什么?改什么样的观念。第二个我想谈改变方法。第三个就是改变对结果的应用。在这儿我简单用一点时间把这两个问题做一点阐述。
既然观念转过来以后,我们紧跟着就是要方法的转变,我们怎么样用科学的、可信的一种新方法去适应我们这样一种改革的需要。
我想改变方法总的原则就是本着科学、多元、有效这样一个原则,建立我们的指标体系,选择我们适当的方面。
科学它是以为着符合教育规律和学生身心发展的规律,这是我们必须要坚持的,否则的话我们评了半天都不科学,跟孩子的身心发展规律不相吻合,那我们就走进误区了。
评价工具必须在这点上,我们选择的评价工具必须要较高的信度和效度。就是你要评什么,你想测量出什么东西,你这个工具能不能够达到你所期望的目标?另外你即便是达到你这样的目标,它可信不可信,跟实际情况相吻合不相吻合?所以信度和效度的问题在我们选择评价方法当中,选择工具当中是非常重要的一点,这也就是所谓的科学。
另外一点就是多元,多元意味着我们要改变,大家都知道过去我们在评价一个学校,上级教育部门对学校的评价看考试分数,甚至于看考进名牌大学的学生数,占的比例有多少。那么我们的学校校长考核老师的时候也是看你这个班里边的平均分怎么样?优秀率如何?老师看学生基本上也是看你的考试成绩,期中考试、期末考试,平常小考的考试成绩如何,这个比较单一,仅仅是用考试本身来评价我们的学生。且不说我们这种考试,昨天一天当中很多专家分析了,这种考试还有很多不科学、不人性的地方。
现在我们强调,在改革的过程中,我们的方法一定要多元。
多元就意味着它要综合评价,切忌用一种方法考察我们的学生,考察我们的老师,考察我们的学校。它要把考试、测试、观察、谈话、记录、问卷、量表、教育教学的素材分析等等,多种评价方法要综合运用,这样我们才能够全面、科学、准确地对我们的评价对象作出科学的结论。
另外我们还在改变方法上强调要有效,怎么样有效呢?有效意味着能够准确、完整地反映学生的综合素质,评价的结果必须要有较强的解释力。如果拿出这个结果来给大家看以后,大而化之,似乎有点印象,但是深说起来又说不出个一二三来,那么这种评价工具不能叫有效。所以它必须有较强的解释力。即使在考核教学效果的时候也要关注到教师和学生学习的关键因素,不仅仅是看一个最后的结果,还要看影响这个结果的因素是什么?这是更加关键的一点。
就方法论而言,我们是希望建立一套科学实用、易操作、解释力强的教育质量的综合评价方法,这样一个方法从方法论的角度讲应该至少包括四个方面:
一个方面是要有一套科学的评价指标体系,这个昨天刘司长、杜老师,我们的黄教授都谈到这个问题,这是第一个要素;
第二个要素是多元的评价工具,这个我刚才做了说明了,不再说了;
第三个,要有一套严格的评价制度,无论是一个区域还是一个学校,还是一个教研组,都要形成一套评价的制度把它常规化、日常化,不是说为了某一种目的我们做一种测试分析结果,而是把它作为我们改进教学的一个常规的制度性规定;
第四个要素,和评价密切相关的有效地改进教育教学的专业机制,要建立这么一套机制,这个机制就是从评价到结果分析,到反馈,到改进教学。昨天下午的四个案例报告都很好地说明了这样一点,因为青羊区通过两年的改革实验,建立起这么一套改进教学的,从结果到分析,到反馈,到改进,这样一种教学的评价改进机制。所以他们才尝到了甜头,取得了很好的效果,这是我对评价方法的几点认识。
以下说一下怎么样改变对评价结果的运用,我们有几点认识:
应该说以不同出发点评价,功能应该是有所不同,评价的重点和评价的内容、方法也都有所不同。那么我们想这次教育部提出的基础教育的综合评价改革,这个改革我想它更加强调把它指向课堂,指向我们学校的各类教育教学活动。同时可能会兼顾到教育行政部门对一个学校,对教师的检测、评价和判断。
其实这个评价我们把它可以分为三大类教育评价,用一个简单的模式来描述,有这么三种情况:
一种是决策咨询的评价,这个就是过去我们往往开展的,对一个地区,对一个区域的检测性的评价,这个指向的是我们的教育行政部门,它主要是在宏观决策上,为了改进宏观决策来服务的。大家都知道几年以前,中国教育部建立了评价监测中心,设在北师大,这个主要是这一类的评价,它通过一定的考试监测,得出一个地区教育教学当中存在的问题,一种普遍存在的现象,然后对教育行政部门作出反馈的意见,给它教育决策改进决策提供咨询意见,这是一类评价。
第二类评价是指向授业的,也就是教学的,这个指向我们的教师,它主要是为了改进我们的教学活动和教研活动,这类评价我们认为是授业评价。
第三类评价是对学生的评价,这个主要指向学生的学习结果,包括他在学习过程中的一系列心理体验、感情体验、道德体验等等,这个主要是改进孩子们的学习状况,它指向的是学生和学生家长。
在评价结果的运用上,我们想还有这么几个问题需要强调一下:
第一,评价结果的运用。还是我前面说过的,主要要指向教师和学生,特别是我们这次改革实验区,主要还不是指向教育行政部门,指向的是教师和学生。目的是为了激励学生和改进我们的教学,这是我们做这次改革实验的一个根本的目的。怎么样激励我们的学生?就是你不能给他一个简单的结果,而是要对这个结果进行深入的分析,在分析的基础上要给他改进的建议,就像昨天我们一个老师,昨天下午一个案例报告提到的,他拿到结果的时候,按照过去惯常的方式,按照一个考试结果的分析,他会感到自己很不错,沾沾自喜,但是当对这些结果进行深入分析的时候他就发现了自己的短板,发现了自己教学过程中存在的问题。
那么对于一个学生来说也是这样。其实我们过去往往容易拿分数来给孩子下结论,比如说一个孩子数学考了40多分,47分比方说,那么我们一般人的概念都认为这个孩子数学能力是差的,数学学得不好,但是我们如果对他的解题过程,对他的学习思维过程进行深入分析的时候发现可能他在某些数学能力上并不低。如果说我们把他这种长处加以发扬,把他的短处加以弥补,有可能他就是一个很好的数学天才,数学学得不好不能笼统地说他不善于学数学,他可能是计算有问题,可能是记忆有问题,可能是理解有问题,也可能是粗心马虎。所以我们有时候仅仅用一个分数给一个孩子下结论说他不是学数学的材料,其实非常武断。如果我们把他这种问题深入地分析出来,我们就发现有时候数学学得不好的孩子,他在某些方面是因为语音学的不好,并不是数学本身的问题,所以我们发现这样一个短板以后我们加以辅导弥补他的短板。这就叫靶向性指导,过去我们就是按照模式从头到尾补一遍。这个我把它叫做“化疗”,全身所有的细胞都要杀一遍。
第二,评价结果的运用和评价过程。一定要成为我们学校每一个老师和校长,以内需为驱动的常态化的自觉的行动。不是为了应付某种上级的评价,上级的考核,也不是为了应付某种实验的需要,而是要把它变成将来我们每一个学校,每一个老师都非常渴望的这样一种评价,非常渴望读到这样一些评价的结果,非常渴望从这个结果当中得到启发,然后来改进我的教学。就像我们每一个关心自己健康的同志,我们每年都要去做体检,做了体检以后我们都非常盼望着把体检结果早一点拿到手,我们看看我们什么地方不好,什么地方好,是不是三高了,是不是脂肪肝了,然后我们有针对性地去看医生解决我们的问题,把它完全变成一种内化的,这是我们要强调的第二点。
另外,对结果的运用不能简单地看他的学业成绩,学业的结果,更要看他学习过程,思维过程当中存在的问题,要根据我们新课改的理念,除了结果以外,更要看他的态度、情感、价值观,这就跟我们刚才胡教授谈到的心理咨询、心理观察,应该很好地结合起来。
最后一点,我们在去年大连评价研讨会上就已经得出了这样一个共识,我们现在做的所有的评价不是功利性的,更不能把它变成高利害的,不能把它变成给学校下结论的依据,也不能把它变成校长们对老师批评的依据,因为这样会本末倒置,所以这点是我们比较强调的,我们在评价结果的运用上有这么一些观点和看法。
我下边用一点时间谈一谈我们怎么改,结合实验区的开展、服务怎么来改。
一项实验工作良好的实施,乃至于取得成功,一般要符合这么几个方面的标准:
1、有效。
2、可靠。
3、可信。
4、可接受。
5、易操作。
6、可反馈。
7、易验证。
这么七个方面的标准,我们认为一个良好地评价实验的成功有这么七个标准。
那么在这七个标准当中有效、可靠、可信体现了我前面科学性的原则,如果你做不到有效,做不到可靠,做不到可信,信度效度比较低,科学性上有问题,不符合学生的身心发展,那它从科学性上讲就没有价值。强调这点我们主要是为了避免实验的主观性、随机性、随意性。我们前期对一些地方做了小规模的实验,我们做过一些了解,发现有一些实验确实存在着随意性和随机性的问题。这个是我们实验能否成功的一个最根本的基础。可接受、易操守,它体现了可实践性原则,也就说它要能够用,不仅仅是一个理论,不仅仅是一个框架,我们要把它拿来操作,这个也体现了我们操作性和人本性的原则。就说我们的评价它要拿来解决政策、制度、理论和技术等方面的实用性的问题,从而促进我们教育的发展,教育质量的提高。这个是我们实验能否取得成功的保障,基本保障。可反馈、易验证,它反映和体现了公正性和普遍性的原则,就是你再一个地方做成功了,那你能不能在其他方面进行验证?能不能重复?如果你这个做完了以后只能在你这儿能够解释,到另外一个地方不能重复,或者重复了以后不能得到相同的结论,相同的解释,那这个实验可能应该说是不成功的。我们做的实验必须要能够重复、可复制,在其他地方也能够解释。
我想教育部为什么这么大的一项改革,只在全国找了30个地市,有的是省级单位,做实验区,其实目的也在这儿,就是先试一试,探索一下,如果我们成功了,它一定能够在全国大面积地推广。如果我们总结完了以后,实验完了以后,仅仅在这30多个实验区可以做,其他地方没有办法推广,没有办法借鉴,没有办法复制,那应该说我们这个实验失败了,所以它必须要用通用性,要用普遍的价值。
依据上面的这七个标准,我们的实验区我想应该在以下几个方面做一些探索和尝试。
首先我在这儿简单说一下中国教育学会的实验区大概分两类:一类,昨天我在致辞当中和刘司长讲话当中已经提到了,教育部去年年底确定了30个实验区,今年年初开了培训会,在会上也做了发言。二司的想法是这个实验区行政来主导,确定了以后,二司是没有人去指导的,它也没有能力组织专家对实验去进行指导,所以它提出一个方法,就是让我们的社会组织和我们的专业组织去对我们的实验区进行提供专业服务,不叫指导,提供专业辅导,总的指导还在二司。那么中国教育学会,还有北师大的监测中心,还有田慧生的课程中心,我们三个单位被二司认可为主要为30个实验区提供专业服务和技术支撑的三个团队,当然不排斥其他的团队也可以进来,这个选择性不在二司也不在我们,在我们30个实验区,你们希望跟谁合作,得到谁的指导,那么就跟他去谈,就跟我们来谈。当然不一定是一家,也可以是多家都来对实验区进行指导,只不过你们几家要分工分明确,这是一类。我们中国教育学会专门成立了实验区办公室,这个办公室首要任务是要为选择我们提供专业服务的国家级的实验群提供专业服务,提供技术支撑,这是一个任务。同时,我们感觉到,也可能有些实验区并不选择我们作专业服务,没有关系,还有好多的区域,好多的地方愿意开展这样一种实验,它没有被纳入30个实验区,但是它愿意做这样的事,愿意做指导,这的信息不断反馈到我们中国教育学会来,我们经过研究之后决定,我们再开辟建立一些中国教育学会的基础教育综合质量评价的实验区,这跟30个不是一回事,但是我们同样负责任地为他们提供专业服务和技术支撑,我先说明一下有这么两种实验区。一会儿主持人会跟大家说我们怎么来建立联系,怎么样开展合作。
在实验区里边,我们大概要做这么几件事情,我们每个同志的资料袋里有一个建设方案,实验区的建设方案,那里面说得比较清晰了,我这儿再花一点时间跟大家做说明。
第一个,我们在实验区里面力求建立一套综合评价指标体系,这个指标体系我前面已经做了说明,它必须符合那七个原则,这个是需要我们根据教育部的文件提出的20个评价的方面,评价的点,然后结合我们教育教学过程中的具体实际,我们一起来研制,怎么样建立这样一套科学综合的评价指标体系。
第二个是研发一套评价的工具,这个工具昨天我们下午案例报告的时候,大家都提到,四个案例报告都提到了,就是我们公众教育研究院经过多年潜心研究,改进了这么一套评价的工具。这个工具在20多个省市自治区经过了反复的实验,有500多万个样本量,同时建立了一些区域的常模和全国的常模。所以这样一套工具我们中国教育学会经过反复比较、分析以后,感觉这套工具符合我前边这样一些评价的理念和原则。所以我们跟公众教育研究院合作,基本上以它的这套评价工具为主为大家提供技术服务,这是第二个要做的工作。
第三个就是学业诊断和培训。通过这样一些工具,根据这样一个指标体系测试出来的结果,我们要对它进行分析,怎么去分析?就像我们拿到体检报告以后,里面有很多数字,有很多指标,如果不是学医的同志,不懂医的同志基本上大部分看不懂,那看不懂就需要有人帮助我们来解释,来分析这些报告,这些数据,它说明了什么?说明我们身体存在什么样的问题?我们的评价也一样,要对这样一些结果进行深入的多方位的,多角度的分析。昨天下午几个报告都很好地用实例说明了这一点。那么这些结果分析出来之后改进教学是一个非常复杂的过程,这个是我们要帮助我们的实验区一起来做的第三项工作。
第四项工作就是培训。我刚才说了,我们要把这个评价作为我们常态的,内化到我们每一个老师心目当中的,日常工作当中去的一种改进教学,提高教育质量的一种方法和手段。那么就需要我们在做这个实验过程当中不仅仅是我们的教育行政部门,不仅仅是我们的校长,也不仅仅是我们的教研员来掌握这样一些理念和方法,我们是希望通过实验区的建设、建立,在实验区的每一所学校的每一个老师都能够掌握这样一套评价、分析、反馈、改进的这样一套方法。那么这个怎么去掌握?中国教育学会在帮助实验区建立前面这样一些制度性的建设,方法建立以外,要对大家进行培训,等一会儿我们还有一个咨询师的项目,要做一个介绍,包括咨询师,包括我们普通教师怎么样能够读懂我们这样一些测评的报告,然后能够理解我们报告背后,它更丰富的内容,它的因素,成因,成因分析等等,我们需要对大家进行培训,所以培训也是我们中国教育学会在开展实验区专业服务当中的一个很重要的内容。
第五个内容,要做的事就是要搭建研究、研讨和交流的平台。我们这两天开的会其实就是大范围地搭建这样的平台,去年我们在大连开了这样一个会,今年在成都,明年我自己设想,这是我自己的设想,我们可能更多的是针对实验区。因为从今年开始很多实验区做起来了,很多在实验过程中出现的问题,一些疑惑,一些需要探讨的理论和实践的问题我想都会清晰出来。我想明年在适当的时候,大概也是夏天我们找一个地方,针对我们实验区这一轮实验过程中出现的问题有针对性定开展一个交流的平台,当然我们也会请一些非常有学术造诣的专家来给我们做一些学术报告,但是更主要的是我们对实验区当中出现的问题,大家一起来研讨、研究怎么样解决这些问题,使得我们实验区能够更加健康地发展。当然在这个平台上做得好的,有成效的,取得了经验的也会得到充分的交流,就像昨天下午我们四个案例报告那样。
第六个内容,最后一个内容实际上我们要做的,更主要的是我们要做的。我们要派专家,派有关人员到实验区去跟大家一起来总结我们实验过程中取得的有效的经验。然后提升这些经验,把它更好地扩展出去,扩散出去,让更多的人能够分享这样一些经验,借鉴这样一些经验,改进他们当地的评价和教学。我们平台会很多,一个是中国教育学会的各种相关学术研讨会,一个是我们中国教育学会的两本杂志,一个《中国教育学刊》,一个《未来教育家》,我们都可以在这个杂志里边开专栏,专门用于我们交流经验,探讨问题,关于实验区的。
所以我想我就花这么点时间,节约大家的时间,把我们对实验区的理解和我们希望怎么做跟大家做一个介绍,下来以后可能我们会跟两类不同的实验区会有一些接触,大家会有一些洽谈,实验之前,我们可能要签一个协议,有关实验的条件、准备等等,我们还会下来继续跟每一个实验区一个一个地洽谈,为每一个实验区量身定制一个实验的指导方案、服务方案,然后扎扎实实地把实验区做好。我们是希望这个实验区既然要做,我们就一步一个脚印把它做出成效来,做出影响来,做出示范来。我也相信通过我们大家的共同努力,我们一定能够在这方面有所成就,谢谢大家!
本文来源:中国教育学会2015年度教育评价研讨会,杨念鲁秘书长发言。
网友评论