Selected-response测试
最多实践®在测试中,每个回答正确的选择回答问题值一原始分;你的总原始分数是在整个测试中正确回答的问题的数量。选择的回答问题由计算机评分。然后,你的原始总分会被转换成一个根据特定版本考试的难度进行调整的比例分数。
构建响应测试
建构式回答问题由两位或两位以上的专业教育者在适当的内容领域进行练习打分。这些个人都经过仔细的培训和监督,以确保他们公平和准确地应用ETS的评分方法。额外的统计检查是为了说明不同版本的测试在难度上的差异。
实践构造 - 响应测试并非所有都使用相同的评分程序。有两种评分模型用于得分实践测试:
- 第一个模型要求两次分数率独立地对每个问题的响应。如果两个评级不同意超过指定的金额,则第三个得分手率为您的回复。
- 第二个模型要求每个建构的回答项目由不同的记分员独立评分。在任何情况下,你的总分都不能完全取决于一个单独的得分者。
在一些构造反应测试中,评分者分配的评分被简单地加在一起,以确定你的总原始分数。在其他情况下,评分首先乘以评分权重,不同的问题得分可能不同,然后添加加权评分以确定您的总原始分数。你的原始分数会被转换成一个根据特定版本的考试难度进行调整的分数。
结合分数
一些测试包括一篇文章和选定响应部分。在学习和教学原则(PLT)测试中,您的原始评分只是正确选择的响应项目的数量和构造响应的额定值的总和。在其他测试中,它是所选响应和构造响应部分上的分数的加权之和。同样,原始分数转换为调整测试难度的缩放分数。
进行预测的问题
预测试问题是在后续版本中使用的那些问题正在尝试。他们是这样不计算在你的分数中,而不是为了了解考生在实际的测试条件下是如何反应的。不是所有的考试都有考前问题。
解释相同的分数
难度的调整使得在不同版本的试卷上给出相同的解释成为可能相同测试。例如,数学:内容知识测试的报告分数为150分,将反映出大致相同的知识水平,不管使用的是哪种版本的测试。
然而,相同的分数不同的测试不一定具有相同的意义。例如,数学:内容知识测试的150分并不反映出与物理:内容知识测试的150分相同的知识水平。