前不久,网传中南大学教务部门要求学生成绩呈正态分布,一教师愤而发帖,称成绩是试卷的结果,不是教务办定的指标,一时引起网上热议。后来中南大学回应“分数无误,沟通有误”,并称他们乐于见到多数学生考高分。发帖教师所教班70%学生在90分以上,差不多没有低分。事情总算有了一个交代。可是,这个交代并没有打消人们的疑虑。
理想的教育会让所有学生完全掌握所学内容,这样他们都将获得满分,因此,不让学生成绩呈正态分布是理想教育的一个目标
上过学,考过试,就会有这样的印象:以总成绩100分计,90以上的高分和60以下的低分,人数都比较少,大多数在七八十分左右徘徊,这就是“中间大,两头小”的正态分布。一次考试中,如果靠近平均分的人数最多,超过或低于平均分的人数依次均匀递减,偏态值在区间(-1,1)内,我们就大致认为成绩呈正态分布。大量随机变量的概率分布都可以用正态分布近似表达,比如人的身高体重。
学生成绩是否应呈正态分布,这一问题充满争议。我们的经验似乎给出了肯定回答。这好像也不难理解:教学内容和过程大致相同,学生的智力与努力程度是影响成绩的最关键因素。而智力或努力程度处于极端情况的只占少数,绝大多数在中间。然而,正态分布却有违教育的理想。数学说,正态分布适用于随机变量,这些变量不受控制。教育学则说,教育反随机,是有目的的,教师的工作是让学生学会他所教的东西。理想的教育会让所有学生完全掌握所学内容,这样他们都将获得满分。即,不让学生成绩呈正态分布是理想教育的一个目标。虽然无法控制学生智力和努力程度的随机性,但是教师可以通过教学手段的改进,尤其通过因材施教来普遍提高学生成绩。
教务部门要评优,自然要求分数有区分度;教师负责传授知识,则没有这方面的顾虑
不过,以上争议很可能只具有表面意义。考试目的不同,成绩分布特征就会有所不同。通常考试分两类:一类是常模参照性考试,如高考,分数大体显示了参加考试者在某一特定人群中的位置。另一类是标准参照性考试,像高中毕业会考,分数大体显示了参加考试者对所学科目的掌握程度。常模参照性考试主要用于人才选拔,它要求有一定的淘汰率,不允许都拿高分。而标准参照性考试则主要用于教学检查。只要学生掌握了教学大纲所列条目,就可以获得满分。只要样本足够大,前一类考试的成绩分布大致应是正态的。后一类考试的成绩分布往往不是正态的,也不该是正态的;教学效果良好时,这类考试成绩大体应呈负偏态分布,即,多数位于高分区。
麻烦在于,通常的考试,兼具两个功能:既是选拔性的,又是教学检查性的。各类学校的学期考试就是典型例子。借助这样的考试,要呈现学生的学习效果,看看他们是否掌握了教学大纲的内容,借此间接呈现教师的教学效果。与此同时,学校还会根据成绩确定优秀学生人选,表彰先进;高一级学校或者用人单位甚至会参考这些分数确定录取名单。然而,这两个功能很难同时发挥到最佳。就算教学效果好,选拔性考试也会要求成绩大致呈正态分布,而教学检查性考试则会无视这样的要求。如果不能通过不同的考试来区分这两个功能,矛盾就会一直存在。学校教务部门与教师职责的侧重点并不相同,教务部门负责日常教学管理,要评优;教师负责传授知识。负责评优的一方自然要求分数有区分度,高分要少;负责传授知识的一方则没有这方面的顾虑。从网上的一些报道来看,这类矛盾在不同办学层次的大学里普遍存在,不只一所高校要求教师提交的成绩尽量向正态分布拟合。
个别教师为了在考核指标上获得较好分数,人为提高学生成绩,这样的成绩更倾向于呈负偏态分布
大学分数的普遍膨胀已经很严重了。个别选修课程甚至从90分起评,拿80分做基准分的不在少数。很多课程不再有不及格的学生。近年来,大学对教师的量化考核越来越严格,课程的选修人数、学生的考试成绩和评教分数构成了教师的考核指标。个别教师为了在考核指标上获得较好分数,人为提高学生成绩。这样一来,他们给出的成绩更倾向于呈负偏态分布。我历来主张,只要不缺考,从1分到100分都要敢给,但永远不要人为拔高。
成绩以何种特征分布,只是一个指标。无论是教务部门还是教师,如果为了达到自己的目的而去外在地追求这个指标,甚至在分数形成之后故意去修改分数,这是削足适履,完全违背了教学规律。根据考试的不同功能,出不同的试题,让试题内容科学合理,更有区分度,方为上策。
(作者:苏德超,系武汉大学哲学学院教授)