介绍

使用重新测试数据来评估和改善努力调整的评分

2020年9月

经过:史蒂文·怀斯,,,,梅根·库赫菲尔德(Megan Kuhfeld)

描述

全国教育测量委员会2020年虚拟会议的本届会议介绍了有关理解和管理考试脱离接触的新研究结果(演讲始于22:55)。

Wise,S。和Kuhfeld,M。(2020年9月)。使用重新测试数据来评估和改善努力调整的评分。全国教育虚拟会议测量委员会。

关于管理考试脱离接触的研究越来越多。一些研究重点是调整快速猜测影响的分数的方法,这是验证项目响应的经过验证的指标。一个例子是努力调整的(E-M)模型(Wise&DeMars,2006),其中在评分过程中识别并排除了快速猜测。E-M评分旨在估计如果他们完全参与,脱离接触的测试者将获得的分数。尽管评估E-M得分调整的准确性是一项挑战,但我们开发了一个允许进行评估的独特数据集。

研究1根据数学地图增长评估的存档RIT评分数据分析了一个数据集,以及在短时间内被重新测试的学生的阅读。raybet 好用吗这使我们能够研究E-M评分的准确性。在两个测试术语中,确定了在一天之内重新测试学生的实例。在这一组中,发现了5,000多个病例,其中学生在第一次测试中表现出脱离接触(10%+快速猜测),对重新测试进行了零快速猜测。表1显示,E-M分数部分解释了观察到的RIT评分差异。

研究2将使用相同的数据集研究一种纯化方法,以提高E-M得分精度。具体而言,将研究使用各种次级阈值来识别在E-M评分期间排除的响应。预计新方法将提高我们估计因测试脱离接触而导致的得分失真的能力,从而提高E-M评分的价值。

看更多

请参阅演示文稿

相关话题