美国教育考试服务中心长期以来一直支持针对成人及以上青少年英语学习者的全球评beplay网站网址估研究,这些人需要在学术或工作相关方面证明英语能力。近年来,beplay网站网址我们对中小学生评估的研究为新引入的针对全球背景下中小学生的评估提供了坚实的研究基础托福考试®主™测试和托福考试初级®标准和综合测试.
我们在该beplay网站网址领域的研究目标如下:
- 有效性和公平性框架- 我们的目的是提供概念框架,以指导发展公平和有效评beplay网站网址估的实践。
- 测试设计框架和原则-我们开发新的测试设计框架和原则,这些框架和原则是理论基础和实际应用的。
- 品质-我们保持一个持续的研究项目,以支持和不断改进现有的测试项目。beplay网站网址作为对质量关注的一部分,我们也进行基础研究,目的是理解语言发展,识别可能影响考生表现的因素,理解评分者的行为,并改进考试评分的beplay网站网址做法。
- 创新-我们寻求设计新的措施,特别是利用新的方法和语言技术来支持英语学习和教学。
beplay网站网址与ETS测试计划相关的研究
- 的新托福®测试-了解更多关于我们开展的研究,以支持对全球大学beplay网站网址学生使用英语进行交流能力的评估。
- 的托业®测验- 了解更多关于我们进行的研究,以支持这种评估beplay网站网址测试者使用英语在全球工作场所进行沟通的能力。
基础研究beplay网站网址
除了我们的研究专业人员为直接支持beplay网站网址托福考试®我们的英语学习和评估研究倡议或基金与国际背景中的基础研究相关的出版社或资金工作。beplay网站网址这些研究的主题包括有效性和公平beplay网站网址框架;测试设计框架和原则;质量;和创新。以下是一些最近的出版物:
有效性和公平性框架
阐明有效性论证
M.凯恩(2012年)
一章罗特利奇语言测试手册, 34-47页。
编辑:G. Fulcher和F. Davidson
出版者:劳特利奇在本书的这一章中,作者讨论了一种基于论证的验证方法,并提供了语言测试的例子。查看引用记录
验证分数的解释和使用
M.凯恩(2012年)
语言测试,第29卷,第1期,第3-17页在这篇文章中,作者讨论了一个两步,基于论证的验证方法,包括(1)指定测试分数的建议使用和解释,(2)评估建议的解释论证的合理性。查看引用记录
一个评估和使用自动评分的框架
D. Williamson, X. Xi, J. Breyer (2012)
教育测量:问题与实践,第31卷,第1号,第2-13页本文提供了一个框架,用于评估和使用构造响应任务的自动评分。该框架包括对自动评分的评估,以及在不断发展的技术背景下实施和维护自动评分的指南。查看引用记录
有效性和性能测试的自动评分
x Xi (2012)
一章罗特利奇语言测试手册,第438-451页
编辑:G. Fulcher和F. Davidson
出版者:劳特利奇在本书的这一章中,作者讨论了在测试效度的发展理论和实践的背景下,对基于表现的语言测试使用自动评分的效度考虑。查看引用记录
基于论证的有效性方法有区别吗?
C. A. Chapelle,M. K.Negright,&J. Jamieson(2010年)
教育测量:问题与实践,第29卷,第1期,第3-13页本文评估了两种不同的效度方法之间的差异,包括Kane(2006)和1999AERA/APA/NCME教育和心理测试标准。查看引用记录
我们如何着手调查考试公平性?
席曦(2010)
语言测试,第27卷,第2期,147-170页本文提出了一种将公平视为有效性方面的方法,并提供了如何在有效性论证中建立和支持公平论证的说明。查看引用记录
试验验证方法
x Xi (2008)
一章语言与教育百科全书,第7卷:语言测试与评估,第二次完全修订版(第177-196页)。
编辑:E. Shohamy & N. H. Hornberger
出版商:斯普林格本章全面考察了有效性概念的演变,并介绍了目前语言评估的验证方法。作者还讨论了语言评估中效度研究的进展如何受益于其他领域的进展。beplay网站网址查看引用记录
我们需要什么以及多少证据?验证自动评分系统的批判考虑因素
x Xi (2008)
一章面向自适应CALL:用于诊断性语言评估的自然语言处理(页102 - 114)
编辑:c.a. Chapelle, y.r。徐俊
出版商:爱荷华州立大学本文说明了如何应用基于参数的方法来应用于使用自动评分系统的使用演讲者®的托福®练习网上口语考试。查看引用记录
测试设计框架和原则
青少年英语语言学习者的语言能力:定义、结构与启示
顾立群
语言测试,第32卷,第1期,第21-38页本研究考察了在以英语作为教学手段的环境中,少儿学生面临的语言需求。查看引用记录
语用能力的定义与运作:回顾与建议
V. T. Laughlin, J. Wain, & J. Schmidgall (2015)
ETS研beplay网站网址究报告第RR-15-06号本文是为英语学习者开发交互式语用学学习工具的更大研究努力中的第一步。beplay网站网址该工具主要用于支持职场语言领域的语用学学习。查看引用记录
语言测试中的循证设计
R.J.Mislevy&C.尹(2012)
一章罗特利奇语言测试手册, 208 - 222页
编辑:G. Fulcher和F. Davidson
出版者:劳特利奇以证据为中心的设计(ECD)是设计和交付评估的概念框架。本书的这一章讨论了ECD在语言测试中有效使用的方法。查看引用记录
创建新道具类型原型
日产汽车公司(2012)
一章罗特利奇语言测试手册, 281 - 294页
编辑:G. Fulcher和F. Davidson
出版者:劳特利奇本书的这一章提供了原型的定义,考虑了原型人群的理想特征,并讨论了原型可以为新评估的设计和开发提供的各种信息。查看引用记录
对英语语言能力进行全面、四项技能评估的案例
d·e·鲍尔斯(2010)
研发连接第14号这篇文章提出了一个测试考生在所有英语交流方式,包括听力、阅读、写作和口语方面的总体水平的案例。查看引用记录
品质
在综合写作评估中使用多个文本:源文本使用作为分数预测器
L. Plakans & A. Gebril (2013)
第二语言写作杂志,第22卷,第3期,第217-230页本研究调查了考生在综合写作任务中如何使用原文,以及在不同的分数水平和任务主题中如何使用原文。研究结果支持了口译综合任务分数作为学术写作测量的有效性。这项研究是beplay网站网址由托福考官委员会资助的。查看引用记录
第二语言体验和口音熟悉度对口语能力评价的影响:一项定性调查
P. Winke,&S. Gass(2013)
TESOL季度,第47卷,第4期,762-789页本文探讨了评分员对考生母语的了解是否影响了评分员对口试任务的定位,以及口音熟悉程度对评分员评分过程的影响。这项研究是beplay网站网址由托福考官委员会资助的。查看引用记录
评分员的第二语言背景是评估口语成绩的潜在偏差来源
P. Winke,S. Gass,&C. Myford(2013)
语言测试,第30卷,第2期,231-252页这项研究调查了口音熟悉度(定义为已经学习了考生的母语)是否会导致评分员偏见。研究发现,评分员对口音的熟悉程度是潜在的偏见来源。这项研究由托福考试委员会资助。beplay网站网址查看引用记录
大学招生中的学术英语考试(EAP)
X. Xi, B. Bridgeman, C. Wendler (2013)
在A. Kunnan (Ed.)语言评估的伴侣.第318-337页,马萨诸塞州莫尔登:著名。这一章描述了英语学术评估的历史,调查了当前的发展,并讨论了未来的趋势。查看引用记录
论文的人机评分比较:性别、种族和国家的差异
B.布里奇曼、C.特拉帕尼和Y.阿塔利(2012)
教育中的应用测量,第25卷,第1期,第27-40页这项研究比较了在特定性别、种族和国家群体中,由机器和人工评分员生成的作文分数的差异。在大多数亚组中,人类和机器的得分非常相似。查看引用记录
使用来自印度的评分员为大规模口语测试打分
十一、莫伦(2011)
语言学习,第61卷,第4期,第1222-1255页本研究调查了说英语和说印度语的人在口语测试中的得分情况。结果显示,印度评分员在印度和非印度考生评分方面的表现与美国评分员一样出色。查看引用记录
反馈对母语英语和二语写作发展的有效性:一项元分析
D. Biber, T. Nekrasova, & B. Horn (2011)
ETS研beplay网站网址究报告编号:RR-11-05本报告回顾和综合以往的研究,反馈对个人写作发展的有效性。beplay网站网址对这一领域研究的元分析表明,反馈对写作的发beplay网站网址展是有益的。查看引用记录
英语口语中重音的超段测量与语言学习者水平的判断
O.Kang、D.Rubin和L.Pickering(2010)
现代语言杂志,第94卷,第4期,554-566页本研究探讨了若干声言论和本土聆听者对口语熟练程度判断的几个声学措施之间的关系。发现语音的Suprase段特征是口语熟练程度和可理解性的强预测因子。这项研究是beplay网站网址由托福考官委员会资助的。查看引用记录
线形图描述任务的性能:受图熟悉度和不同任务特征的影响
席曦(2010)
语言测试,第27卷,第1期,73-100页本文描述了一项在口语测试中系统地操纵线状图描述任务特征的研究,目的是减轻图熟悉度的影响,图熟悉度是测试中结构无关方差的潜在来源。查看引用记录
反向语言刻板印象:衡量听者期望对言语评价的影响
O. Kang & D. Rubin (2009)
语言与社会心理学杂志,第28卷,第4期,第441-456页这篇文章研究了一种被称为逆向语言刻板印象的现象,在这种现象中,讲话者的群体成员身份的归因会导致对其讲话的扭曲评价。这项研究是beplay网站网址由托福考官委员会资助的。查看引用记录
创新
语音自动评分系统中两种评分方法的比较
X. Xi, D. Higgins, K. Zechner, D. Williamson(2012)。
语言测试,第29卷第3期371-394页本文比较了两种可供选择的评分方法-多元回归和分类树-用于自动语音评分系统在实践环境中使用。查看引用记录
冠词和介词纠错系统对英语学习者的作用:反馈和评估
M. C. Chodorow, M. Gamon, J. R. Tetreault (2010)
语言测试,第27卷第3期419-436页本文描述和评价两种识别和纠正英语冠词和介词写作错误的系统。结果表明,两种系统都有助于误差修正。查看引用记录
语言学习者自动语法错误检测
C. Leacock, M. Chodorow, M. Gamon, & J. Tetreault (2010)
人类语言技术综合讲座,第3卷,第1号,第1 - 134页本卷提供了自动方法的概述,这些方法已经开发出来,用于识别和纠正多种语言中的不同类型的语法错误。提出了语法错误自动检测的研究方向。beplay网站网址查看引用记录
自动评分和反馈系统:我们在哪里?我们将走向何方?
席曦(2010)
语言测试,第27卷,第3期,291-300页这篇社论是《圣经》特别版的序言语言测试这为自动评分和反馈系统提供了一系列新的方法和途径。讨论了与自动评分和自动反馈研究相关的背景信息和问题。beplay网站网址查看引用记录
采用具有语言特定发音困难的阅读语音,适应不同熟练度非母语自发语音的语音识别器的声学模型
K.Zechner,D.Higgins,R.Lawless,Y.Futagi,S.Ohls和G.Ivanov(2009)
发表在《美国科学院院刊》上的论文Interspeech 2009:国际言语传播协会第十届年会,第1-5卷,612-615页本文提出了一种非母语自发语音识别器的声学模型自适应方法,以识别考生在英语口语测试中的反应。查看引用记录
非英语母语者写作搭配错误检测的计算方法
Y.Futagi,P.Deane,M.Chodorow和J.Tetreault(2008)
《计算机辅助语言学习》,第21卷第4期,第353-367页本文描述了一个用于检测英语学习者写作中搭配错误的自动化工具的原型。对系统进行了详细的误差分析和可能的改进。查看引用记录