在我国目前的教育评价实践中,对考试成绩的解读仅止于得到一些简单的描述统计量(如原始分、平均分、排名等)。殊不知,这些数字貌似非常精确,容易统计,便于比较,但它完全不同于物理测量单位的直观含义,纠缠其中实在是极大的谬误。
我国的教育评价肩负着检验学生学业质量,选拔人才,考核教师、学校绩效等重要使命,在过去的几十年中,积累了很多宝贵的经验,但仍然存在着一些弊端。
首先,各级各类大规模教育考试的成绩被普遍用来作为评价学生、教师及学校教育成果的唯一标准,从而导致了对分数片面、盲目的追求。由于目前最主要的考试(如中考、高考等)都较侧重书本知识,教学实践往往受其影响,强调记忆性知识,而忽略其他能力素质、实践技能等,严重制约了学生全面、均衡的发展。
其次,在我国目前的教育评价实践中,对考试成绩的解读仅止于得到一些简单的描述统计量(如原始分、平均分、排名等)。殊不知,这些数字貌似非常精确,容易统计,便于比较,但它完全不同于物理测量单位的直观含义,纠缠其中实在是极大的谬误。例如,在同一次考试中,60分和70分的差距截然不同于90分和100分的差距。即使两个考生的分数完全相等,也不能认为他们的知识、能力与学习成果完全相同,因为构成总分数的各部分的具体分数可能存在差异。同理,某次考试的70分和另一次考试的80分也无从比较,因为试题内容、难度等都可能存在较大差异。
同时,这些统计量与各学科预设的学业质量标准缺乏联系,使得我们无法从中解读到如何取得进步的反馈信息。学生仅能看到自己依据本次考试在群组中的排名,但究竟哪些方面学好了,哪些方面欠缺了,是否取得进步,却不能从考试结果中体现出来,更不用说客观评价学生进步的程度了。这很容易造成学生死啃书本,却收效甚微,逐渐失去自信,影响学生健康发展。
在对教师、学校评价时,很多地区会采用以单一考试(或升学率)为主要依据的评价方式。这不仅会使教学活动进入应试教育的误区,并且由于这种做法不考虑学生入校时的基础、学生的家庭背景等因素,还会对一些入学学生基础较差的学校产生较严重的负面影响。我们对改进教育评价有三点建议:
一、政府对教师及学校绩效采用更为科学、公平的增值性评价。
现行的政府对学校的评价缺少体现教育规律的客观标准,实际上是以单一的考试成绩和升学率作为主要标准。这种评价标准和方法把拥有不同生源和条件的学校,以同一标准衡量学校工作的绩效,使占有优质生源的学校始终处于优势地位,而那些生源和办学条件差的学校则不能根据学校实际提高办学绩效。增值性评价的概念即评价学生在一段时间教育过程后的“成长”,以变化取代原来对学生在某一个特定时刻的状态的关注。这种评价方式将学生原有的学术成绩及家庭背景等多个因素考虑在内,提出一个合理增长的模型。它不光关注于学习过程的最后产出,更着重学习过程所带来的增长,凸显了“以人为本”、尊重每一个学生的教育思想。运用这种方法评价学校、教师绩效,有利于促进学校和区域间的公平比较,有效激发生源质量差的学校和区域促进学生学业进步的动力。
这种新的评价方法在世界上很多国家得到了关注和研究。特别是美国在2005年对《不让一个孩子掉队》法案作出重大调整后,政府要求各州建立基于学生水平增长的绩效模型,增值性评价成为评价实践和研究的热点。一些州通过建立纵向链接的测量工具,将学生每一年的学业水平增长与该州的标准要求,学生历史水平和学校历史水平,其他学校增长情况等,进行多角度的跟踪评价。
我国的增值性评价研究起步较晚,目前仍采用学校名次变化比较、标准分比较等较原始的评价指标。我们可以在此基础上,加快步伐,使这一更科学的新方法得到长足运用。
二、改进评价技术,科学解读评价结果,为学生和教师提供信息反馈,提供发展性评价。
在过去的评价中,成绩主要用来将学生排序,很难了解成绩背后每个学生的优势和不足。要全面细致地阐释评价结果,从中了解学生个人及群体的能力结构,我们必须改进目前以原始分为依据的评价技术,采用当代教育测量理论及先进统计方法,结合课程设置、教学大纲等学业标准,深入细致地分析分数的“成分”和“含量”,并联系各种背景信息,研究影响学业质量的因素。这些反馈信息可以为学生弥补不足、促进均衡发展,以及发挥优势、培养个性化特长,提供有效依据。
在美国等教育评价发达地区,专业评价机构已常规性地向政府、地方教育机构、学校乃至个人提供详细书面反馈。以国际大型标准化考试PISA(“学生能力国际评价项目”)为例,组织方OECD(国际经合组织)不仅公布收集到的各地学业水平、政府投入、学校组织、个人生长环境等方面的总体信息,还深入研究各种影响学业的因素,教育质量发展的趋势等。同时,还向各地提供分析该地区情况的分报告。此外,美国等国家还通过向在职教师提供教育评价知识培训,帮助老师解读和利用各类评价结果,因材施教,提高教学质量。
三、改进教育评价的标准、内容和方法,形成各种知识与能力并重的多元综合评价。
我们可以改进测试内容,转换命题思路。例如,近年来我国的高考正在不断尝试新的科目设置方案(如“3+2”,“3+X“等),力求在评价中强调学生全面发展。此外,我们还可以借鉴优秀国际考试的宝贵经验,改进考试的内容和命题的方法。如我国上海等部分地区参与的国际考试PISA,其测试内容与学校课程并不直接相关,而是关注运用知识技能应对现实生活挑战的能力,例如学生能否对书面信息的分析、比较、对比和评价;能否有效地交流思想与观点等。PISA的命题往往通过需要运用或汲取知识和技能的情境来实现。
除了传统的科目考试外,我们还应该丰富评价方式,拓宽评价范围。如通过成果展示等其他平台,评价在传统纸笔考试中无法显现的技能或才艺。另外,学生的学习策略、学习兴趣、心理健康等方面,也是一个全面、多元的评价体系应当囊括的内容。
在评价标准方面,固定而僵化的准绳不利于培养学生的想象力和创造力。如何改进标准,在评价中向学生提供开放性问题,对科学创新的尝试给予更多的权重等,正是目前评价研究开始探索的课题。