考试的定义为“用来获取某些行为的方法,其目的是从这些行为中推断出个人具有的某些特征。”
四种语言测试法包括写作-翻译法、结构主义/心理测量法、综合法和交际法。
一、 按学习阶段来分
1、 编班测试(placement test)
也叫分级测试。我们都知道学生程度不齐。教师难教,学生也难学。所以常常需要将学生按程度分班,以利教学。分班测试就是为这一目的而设计的。它要考查的是学生目前现有的语言能力,所以水平测试的题目常可作分班测试用。有时上一个学期的成绩测试结果也可作为下一个学期的分班依据。由于分班测试往往时间紧迫,没有太多的时间准备试题和改卷,所以常选用间接测试的客观试题,如多项选择题和完型填空等。
2、 随堂测试(classroom tests)
教完一课书之后进行的小型测验。测试的分量小,时间短,内容可以多样:拼写、听写、填空、释义、翻译等。题目不宜过难,大部分项目是复习本课的内容。
3、 期中测试(mid-term tests)
4、 期末测试(mid-term test)
三个目的:促使学生巩固所学的知识,评价一学期的教学效果,调整下学期的教学安排。
二、 按照用途来分
1、 水平测试(proficiency tests)
衡量受试者综合运用外语能力的测试。它的目的是确定受试者目前是否具有所需要的外语水平。它的特点是并不限制任何一个教学大纲或任何一本教材命题。要考查的不是对所教的课程学得怎样,而是根据未来对外语的使用要求考查受测者目前的外语熟练程度。典型的水平测试例子有中国的EPT,大学英语四六级、英语专业四八级、美国的TOEFL和英语的ELTS。
2、 成就测试(achievement tests)
成就测试的目的是评价、衡量学生在掌握所学教材方面取得的进展。通过成就测试,我们能确定学生在其所在班级中的相对位置,了解其掌握知识的程度和应达到的学业标准之间的差异,并达到巩固所学知识的目的。成就测试的例子有期末考试、中学毕业会考以及某门课程结束时所进行的考试。评价教学效果的测试也是成就测试。
3、 潜能(或素质)测试(aptitude tests)(语言禀赋测试)(学能测试)
语言禀赋测试的目的是评估受测者在语言学习方面的禀赋或潜在能力,以预测其在学习外语时取得成功的可能性。禀赋高的人学得就快、就好。语言禀赋测试一般是用一种人造的语言来进行测试,所以受测者参试时的外语程度不影响测试结果,有的人也许从未学过外语也可以考得较好。测试的内容主要有:语音与符号的配对能力、辨认能力、记忆力、对语法结构的感受力以及归纳能力等等。但目前对语言禀赋测试的实际效果仍有争议。
4、 诊断测试(diagnostic tests)
诊断性测试是为教学服务的。它不是考察学生的总体语言水平,而是针对所学的某些具体内容和语言知识进行测试,以了解学生的困难所在。我们可以对某些学习难点进行诊断性测试。如果结果显示学生对此已经掌握,则不必再花太多功夫。通过诊断性测试,可以查明学生的困难之所在以及产生这些困难的原因,使学生知道哪里需要多加努力,而教师则可有针对性地采取补救措施。通过分析学生的错误,教师的教学也就更加有的放矢。诊断性测试宜采用分列式测试,哪里有问题,一目了然。若采用综合性测试,则不易查明问题所在。比如采用听写的形式,就不容易分清造成考得不好的原因到底是因为听不懂还是因为不会写。
三、 按照考试方式来分
1、 分离性测试(discrete-point tests)
把知识和能力分成若干小的单位,逐个的进行测量。例如,我们可以把语言分成语音、语法、词汇等,然后在设计相应的测试题目。分离性测试一般集中考查语言的某一方面,或考查学生单方面的技能。其考试形式主要为多项选择题。
在分列式测试中,每个题目只考一个语法构成成分的某一点,如某个音素、某个单词、某条语法规则等。此外,每个题目必须是独立存在的,与前后的其他题目无关。更换其中一题不会影响学生对其他题目的回答。最典型的分列式测试题为多项选择题。但看完一篇阅读材料后考理解能力的多项选择题则不属于分列式测试。
分列式测试的长处在于:(1)针对性强。学生无法回避所考内容,尤其适宜作诊断性测试用。(2)评分客观、准确。不受人为因素的影响。(3)易于更换不合适的题目。便于在需经难度检验的大规模测试中使用。
2、 综合性测试(integrative tests)
一次同时考查语言的多方面的知识和技能的测试。现在常用的听写、完型填空、翻译、作文等都属于综合性测试。
综合性测试考察的是受测者理解和运用语言的综合能力。国此各种各样的语言构成成分和技能都将同时受到检验。例如外语面试,受测者不仅要听得懂对方的问话,还要运用所掌握的语言知识和技能准确地表达自己的意思。又例如作,受测者的许多技能都同时受到考查,如词汇、语法、拼写、构思、组织材料等。其他的例子还有完型填空、听写、作文等。
四、 按照对考试分数的解释来分
1、 常模参照性测试(norm-referred tests)
当我们判断一个分数是好还是不好时,主要有两种解释方法:一个是参照常模,另一个是参照标准。常模指的就是一群类型相同的人的水平的平均值。常模的功用就是给测试分数提供比较的标准,即给测试分数提供参照点,从而使人们可以对测试分数加以解释。常模参照测试就是参照其他考生的情况来解释某人的得分的测试。在这种情况下,衡量的标准是相对的,而不是绝对的。常模参照测试的目的是要显示考生间外语水平上的差异,提供相对的等第顺序,所以它必须能将分数拉开,以确保可靠的区分性。如果在一个常模参照测试中,人人都得高分,那它决不可能是一个成功的测试。水平测试属于常模参照测试。尤其是大规模的标准化测试,因为要保持每次测试的难度相等,具有可比性,单靠在题目上下功夫很难做到,而考生群体的水平则是相对稳定的,所以得靠常模参照测试来达到这一要求。
假设某次TOEFL成绩的平均分位512分,标准差位66,某考生在这次考试中得了578分,正好比平均分多出一个质,即一个标准差的分数(512+66=578)。按正态分布的原理,84.13%的考生成绩低于578分。