测量和标准错误

今天早上，当我踩踏浴室秤并感到熟悉的内gui和失望时，我很快提醒自己，浴室秤是不完美的衡量设备。我的真实重量很可能落在可能的值范围内，大致集中在指定的重量上。很快，我计算出了我想要它的程度。我认为，这个价值肯定是我的浴室秤的错误余地。

除了怪异的合理化之外，衡量人类（或其他）属性的行为始终是不完美的科学。无论我们是试图用浴室尺度，用胶带测量的高度测量体重，还是使用地图评估进行学术成就，我们的测量中总是有一些摆动空间，因为如何精确测量这些数量有限制。raybet 好用吗观察到的地图得分总是有相关的测量标准误差（SEM）。例如，如果学生在地图阅读测试中以3个RIT点的SEM得分，那么在我们的测量能力范围内，195是她/他的最可能的分数，但是“真实”得分可能是一个更高或低一点。标准误差传达了多少高或更低。较小的标准误差意味着更精确的测量。

通常，观察到的地图得分的精度可以通过两种方式提高（即SEMS降低）：增加测试事件中的项目数量，以及仅包括其难度在学生当前成就级别相对较近的项目。测试中的更多项目意味着更多的机会观察学生的成就，从而获得更高的精度。同时，错过的物品太困难了，或者对太容易的项目的正确响应，几乎没有关于学生当前成就的信息。这就是为什么阅读测试（每个大约42个项目）的SEM往往比数学测试的SEM略大，而数学测试的SEMS却大约有50个项目。这也解释了为什么自适应测试往往比相似长度的固定形式测试更精确，因为自适应测试在学生做得很好时会选择更艰难的项目，而这些项目在做得不好。对于固定的表单测试，可以同等的精确度测量所有成就水平的学生，必须太长时间才能实用。

随着时间的流逝，我们试图测量个体时，标准错误结合在一起。例如，如果我想知道学生随着时间的推移已经发生了多少增长，并在秋季再次管理地图，我需要考虑两个时间点的标准测量错误对发生了多少增长的现实评估。如果从上面的示例中进行了第二次测量的阅读学生，并得分为212，标准误差为3，则观察到的增长将为17位。变更分数的标准误差将为4.24，这只是平方和求和的单个标准误差的平方根。在此示例中，与变更评分的标准误差相比，从秋季到春季（17分）的变化相对较大（4.24），因此我们可以非常舒适地得出结论发生了真正的增长。但是，如果我们的假设学生在第二次测试管理上仅得分199（标准误差为3），那么我们的结论将不太确定。在第二个假设中，观察到的生长仅为4点，而标准的生长误差仍然为4.24。换句话说，观察到的增长不大于标准误差，因此我们无法确定实际改进的情况。

尽管标准错误有时可能会对解释单个分数很麻烦，但在检查组时，它们却较少。原因是在大多数情况下，这些测量错误是随机的。有时它们有点高，有时有点低。在大多数情况下，当您查看小组时，他们倾向于相互平衡。这就是为什么当您查看组时，您可以比个人更精确地测量组的标准误差（即标准误差要低得多）。换句话说，即使个人随着时间的推移几乎没有增长，小组水平的增长也可以比个人水平的增长更高的精度和确定性来衡量。

所有成就测试都包含一些测量误差。但是，由于MAP适应了学生的当前成就水平，因此地图得分是尽可能精确的，并且比相似长度的固定形式测试要精确得多。了解学生观察到的分数，以及标准错误告诉我们观察到的分数，可以帮助我们设定更合理的目标，并得出有关学生在成就中的成就和成长的更有效的结论。

教。学。生长。

教。学。生长。教育博客

测量和标准错误

建立数学信心

对于决策者

阅读的ABC

为你推荐

建立数学信心

对于决策者

阅读的ABC

保持更新