杂志文章

比较不同的响应时间阈值设置方法,以检测大规模评估的努力

2021年4月

出版于:

大规模教育评估raybet 好用吗9,,8 https://doi.org/10.1186/S40536-021-00100-W

经过:詹姆斯·索兰(James Soland),,,,梅根·库赫菲尔德(Megan Kuhfeld),,,,约瑟夫·里奥斯(Joseph Rios)


抽象的

低考生的工作是对许多考试成绩有效使用的主要威胁。幸运的是,已经开发了几种方法来检测非掩盖物品响应,其中大多数使用响应时间。为了准确识别无效的响应,必须设置响应时间阈值,将这些响应分开努力的。尽管其他研究比较了不同阈值定位方法的疗效,但它们通常使用模拟或小规模数据进行。当在此类研究中使用大规模数据时,它们通常不是来自计算机自适应测试(CAT),仅使用少数项目,或者不全面地检查不同的阈值设定方法。在这项研究中,我们使用了从美国2,056所学校中的728,923名3至8年级学生的阅读考试成绩,该猫摄入了一只猫,该猫由近12,000件商品组成,以比较阈值设定的方法。这样一来,我们为使用给定方法识别无效响应的大规模评估的开发人员和管理人员提供了指导。raybet 好用吗

看更多

访问日记

本文在NWEA外发表。全文可以在上面的链接上找到。

相关话题