欢迎访问职称论文网!
教育论文

主要技术广泛应用于国际大规模考试中

主要技术广泛应用于国际大规模考试中


(1)测试等值。


测试等值是教育考试作为国外工业化形式的核心技术。等值在理论上并不复杂。通过一定的数学模型将测量相同特征的不同测试分数转换为相同单位系统的过程是测试等值。[2]它将不同试卷版本的考试分数转换为相同的分数系统,使考生参与测量相同知识和能力测试的不同试卷版本时,可以直接比较分数,不会因难度不同而造成不公平。


目前,基于等值数据分析的测量模型具有经典的测量理论(Classical Test Theory,CTT)以及项目反应理论(Item Response Theory,IRT)这两种方法分别对应于传统的等值方法和IRT等值方法。在等值的具体方法中,基于IRT的等值方法比基于CTT的等值方法具有许多优点。


在国际领先的技术考试中,首先要运用IRT等值测试理论进行题目建构、参数校准和分数等值转换。这样形成的测试工具就像用尺子测量学生的身高一样,测量结果是绝对的(忽略误差)。通过使用一些涵盖不同难度的共同题目来构建和校准试卷,不仅可以从多个维度测量学生不同层次的能力和属性,还可以对不同试卷之间的考生和题目进行水平比较,从而实现国与国之间不同地区之间的横向比较和跨年度的纵向比较。这是基于经典测量理论的评价工具根本无法实现的。


(2)增值评估。


近年来,随着社会需求的增加和统计测量技术的不断进步,增值评价在考试评价领域得到了广泛的应用。增值评价是通过跟踪研究设计,收集学生一段时间内不同时间点的标准化测试结果,根据学生自身测试结果进行纵向比较,考虑其他不受学校或教师控制的因素对学生成绩的影响,考察学校或教师对学生学业成绩的净效果,实现对学校或教师效率的科学客观评价。从增值评价的定义可以看出,其核心思想是“增值=输出-输入”,即其对学生的评价控制着学生的初始水平。同时,增值评价也控制了学校和教师无法控制的因素,因此可以很好地评价学校在促进学生学业水平方面的作用。与传统的学校评价模式相比,增值评价具有全面考察学生发展影响、强调发展评价标准、注重起点、注重过程、促进学校改进的特点,在促进我国教育均衡发展、促进学校特色发展、实现教育教学公平方面发挥积极作用。


(3)垂直标定。


根据“是否使用垂直量表”,常用的增值评价方法可分为两类。相对而言,使用垂直量表的增值评价逻辑更严格,但对技术的要求也更高。垂直量表的构建需要垂直校准,并将不同段落但内容领域相同的测试分数放在相同的能力量表上。


一般来说,垂直量表的构建主要包括以下步骤:选择和实施数据收集设计、标定研究、选择构建分数报告量表的方法进行参数估计和评价量表的标准。垂直量表常用的数据收集设计有三种:共同问题设计、等组设计和链接测试设计。在理论上模拟和比较这三种设计方法的优缺点并分析实际操作的可行性后,本研究选择了共同问题的设计方法。


热门期刊