欢迎访问职称论文网!
教育论文

高利害考试用于绩效问责的初步实践和探索

高利害考试用于绩效问责的初步实践和探索


教育部考试中心从2006年开始实施国际学生评价项目(Programme for International Student Assessment,PISA)以科研为先导的中国试验研究项目,通过PISA2006、PISA2009、2012年PISA三轮中国测试研究实践借鉴了PISA先进的考试评价理念、理论和技术,并将其应用于高考、高考等高利益考试的研究和实践。2010年以来,教育部考试中心与海南省考试局合作,利用海南省统一考试和高考数据,实现不同年度的高考和高考;同时,在语言、数学、英语三个核心学科建立了高考联系的垂直尺度,到目前为止,2010年、2011年、2012年的语言、数学、英语能力被放在一个共同的量表上,实现了结果的直接可比性。利用这些研究成果,通过中学教学阶段最具代表性的大规模社会化考试,人们可以一目了然地了解海南省任何中学、任何县市的学术质量变化。未来,通过有意识地安排锚测试(专门设计连接两次测试并统一测量表的工具),每个新的年度测试结果都可以放在这个共同的测量表中。从技术上讲,这种量表转换和统一的考试结果使用起来更为强大。例如,不同年份的两个分数可以直接比较甚至交换,这使得多次考试对应一次录取具有技术可能性。这种共同量表的更大价值在于将高考和高考的相对测量转化为绝对测量,也使高利益考试在学术质量评价中具有技术可能性。


具体来说,本研究涉及高考九个学科(语、数、英、理、化、生、史、地、政)和高考三个核心学科(语、数、英)。研究的第一个任务是等待相邻年度同一科目不同试卷版本的考试成绩和题目参数。研究采用了非等组锚测试(Nonequivalent Groups with External Anchor Test,NEAT)数据收集设计[论文网络] LunWenData.Com],以不易产生评分误差的客观题为锚题,分别在中考和高考正式考试前一个月抽取考生样本进行测试,正式考试结束后共同计算测试结果和测试结果。主题参数校准采用Rasch模型,采用国际流行的Conquest软件。参数量表转换采用“固定共同问题参数”算法,建立了不同试卷版本的能力值和相应的预期分数转换表。


研究的另一个重要内容是建立贯穿整个高中阶段的学科共同能力量表。根据我国高中教学内容和考试数据提供的可行性,笔者选择了高中入学考试和高考的三个核心科目(语文、数学和英语),并利用高中二年级设置的链接测试实现垂直校准,将高中入学考试与高考分开的不同考试量表统一为一个共同的尺度。这样建立的学科能力共同量表成为评价整个高中教学的标准量尺,特别是为中学总结教学得失提供了有力的工具。这个量表给一些过去因学生素质高而在入学竞争中处于有利地位的学校带来了压力,使学生素质相对较低、竞争无望的所谓“差校”看到了自己的成绩和进步。教育行政部门可以根据这些宝贵的数据和信息,真正实现分类指导,落实全体学生的发展评价,体现教育、教学、考试的系统整合,帮助不同地区、不同学校、不同学生更好地适应性发展。


在通过学科共同能力表对高考和高考链接进行增值评价的实验过程中,研究人员专门为各级教育行政部门和中学编制开发了网站和客户端软件。各级教育行政部门的领导和专业人员可以利用客户端软件直观方便地浏览各种评价信息,改进决策和教学。为了防止学校之间的盲目比较,中学管理人员和教师可以使用网站登录密码查询学校或学科在全区或全省的相对位置和发展评价图表数据。


在利用垂直校准实现共同能力量表增值评价中,学校学科能力增值评价分层图被当地和学校管理人员称为“绿色评价”的量化尺度。图1为2010年海南省语文学科能力增值评价分层图,左右纵轴为垂直校准建立的语文共同能力量表,单位为能力转换值。左边是高考,右边是高考。


可以想象,经过三年的学习,绝大多数学生(或学校)在这个共同能力表上的得分将从较低到较高。然而,不同个体在这两次考试中的得分差异(增值)是不同的。有的增值幅度大,有的增值幅度小。从数值上看,这种增值不仅与每所学校的进步有关,也与其原有的水平有关。根据每个数据集的总体情况,软件用四个不同深度的灰色区域表示每个群体中不同学校的增值变化,最深的区域表示中考或高考总体水平达到75%以上。图1右侧上方的图例依次说明了图中不同深度的灰色区域的含义。


如果一所学校在高中入学考试和高考中都处于深色区域,这表明该学校一直处于较高的水平。如果学校在高中入学考试中处于较深的区域,高考中处于浅色区域,则表明相对负增值;相反,如果学校在高中入学考试中处于非常浅的区域,而高考中处于非常深的区域,则表明有明显的正增值。


模板提供了一个量表,可以在绝对值和相对学校之间衡量学校的进步。每个学校都可以通过网站登录信息看到自己的绝对发展和相对发展。教育行政部门的领导和专业人员可以利用客户端软件将几所类似的学校放在这个量表上,比较其增值规模。图1中,A、B两所学校展示了同类学校的对比。从图1可以看出,A学校高考平均语文能力值为36.6,在全省第25百分点到第50百分点之间。其高考平均语文能力值为50.7,在全省第500分点到第25百分点之间。因此,A学校从高考到高考在各类学校中的相对地位有所下降。A校入口学生素质较差,可能由于学生起点不高,持有“无论学生多么努力”的思想,使其在增值评价体系中处于不利地位,使出口学生的平均能力水平在省内下降到较低水平。从增值评价的角度来看,B学校的起点与A学校相似。入学生中考平均语文能力值为35.8,略低于A学校。然而,B学校并没有因为生源不理想而破罐破摔,实际上将学生高考平均语文能力值提高到了57.7,在全省第50百分点到第75百分点之间,虽然在高考结束时,中等水平略高,但对于B学校的学生和家长来说,他们是幸运的,因为B学校的校长和教师团队只有不放弃任何学生才能取得这样的成绩。如果仅从高考一次性结果来看,B校在全省并不突出;从增值的角度来看,学校的努力值得称赞。


热门期刊