【摘 要】在测试的结构型、交际型和任务型理论之后,基于受测主体特征及测试客观情况的“人性化”测试逐渐受到测试研究者的关注。高考英语口语测试具有其独特性。研究以2016年陕西省高考英语口试的学生测试数据为基础,设计高考英语口试设计模型,且从测试的特殊性视角探讨陕西高考口语题型设计的不合理之处,提出相应的解决策略,同时对于高考英语口试的题型设计原则进行探讨。

【关键词】高考英语口语测试 测试设计 人性化测试 陕西省高考口试

基金项目:陕西省教育厅科研项目(16JK1028)。

高考英语口语测试是高考英语考试的一个重要补充,它对全面考察学生英语语言能力起着重要作用。尤其是它为语言相关专业及院校的人才录取提供重要参照依据。因此如何科学合理地设计考试形式,以提高考查的准确性就成为重中之重。

应试者特征在过去三十年内成为语言测试工作者所关注的一个热点,是众多研究的对象[1](P8)。刘润清、韩宝成[2](P43)认为应该根据考生水平、考试目的、规模、时间长短来确定试卷各个部分的内容及所占的比重。Weir[3](P51)将影响受试者测试表现的个人特征总结为:生理因素(Physical)、心理因素(Psychological)和经历因素(Experiential)。生理因素主要指疾病(ailments)、适应障碍(disabilities),心理因素包括性格、记忆和认知等方面因素,经历因素包括教育、考试准备情况和考试经验等。尽管此类研究已有较丰富的理论成果,但如何基于这些理论,结合考试的特殊性对不同类别考试进行设计还需要进一步探讨。

高考英语口试定性分析

英语口语测试的设计需要建立在对受测主体特殊性及测试客观因素研究的基础上。只有充分考虑到学生群体的特点,测试设计才能具有合理性,测试的准确性才能有所保证。

陕西省高考口试具有自身的特殊性。首先,受测学生普遍英语听力能力薄弱。这与我国的现行高考模式有关,其注重文本的测试形式必然导致学生及高中英语教师在高中阶段对英语听力能力不够重视。其次,学生英语口语能力有限。相对于学生的读写能力,英语口头表达能力失衡。这一点与第一点原因同源。再次,参考学生对于口语测试的基本原则不熟悉且缺乏应对策略。由于高中阶段对于英语口语能力缺乏相应重视,学生对于口语测试的基本原则及对应策略不甚了解。第四,高考英语口试对于参考的绝大多数学生而言,为其人生的第一次正式的、面试性质的测试。加之这类学生心智发展得相对不成熟,且此面试下属于“高考”范畴,因此它的重要性及其所产生的负担感被强化。最后,考试受时间条件限制。陕西省高考口试分区进行,为达到公平公正,考试需在一天内完成,每位学生的测试时间被限定在较短的时间内,一般为3至5分钟。

“构念”是语言测试理论中一个重要概念,意为根据测试行为所做的推论和解释,APA (American Psychological Association)首次将其系统地运用到测试设计中[4]。对于构念的清晰掌握可有效地指导测试设计人员的设计行为,从而达到更加具有指导意义的准确设计。根据韩宝成[5](P355)对语言测试构念的总结分类,其主要包括“能力中心”和“基于任务”的构念观。前者是指通过测试观察对受测主体在现实情境中语言能力及完成任务情况的推测。后者不考虑应试者潜在语言能力,主要侧重于对受测者任务完成情况的推测。高考英语口试主要针对高中毕业学生的英语口语能力进行测评,它侧重于考生语言能力的反应,故应该采用“能力中心”的构念观。

高考口试人性化设计理论模型

高考口语测试的人性化设计是指设计人员根据影响考试因素所做出具有针对性、更加合理的测试设计,从而追求最真实、最准确的测评结果。影响高考英语口试的主要因素包括受测人群的特性、考试客观情况以及测试构念,统称为一级指标或输入指标。测试设计的输出指标包括:测试类型的确定、题型设计和评分标准的编制。高考口试人性化设计流程如下图所示。

上图指出合理的高考口试应当建立在对受测主体及测试客观情况正确分析的基础上。而对于这两者的分析又决定了设计前测试构念的确定。测试前构念的确定能够准确地对测试进行定位,尤其是对测试所偏重的测试目的进行准确的把握。即根据英语语言测试的发展类别,确定测试定位于结构型口语测试、交际型口语测试、任务型口语测试还是综合型口语测试。而对测试准确的定位又是测试题型设计及评分标准制定的基础。

2016年陕西省高考口试问题描述

现对2016年陕西省500名考生的考试情况进行了记录,所表现出的问题主要有三种:学生对问题不解、学生回答过于简略和学生出现紧张情绪。

表1 陕2016高考英语口语问题统计

学生对题目不理解表现为需要测试教师重复题目或者对题目进行简化解释。出现此问题的学生数目为126人。调查发现500名参考学生中有437名学生作答过于简略,出现了所谓的口语考试教师比学生表述多的问题。受测学生中出现明显紧张情绪的有215人。

问题分析

以上2016年陕西省高考口语测试的结果显示,测试题型的设计具有一定的不合理性,尤其是不能针对特殊受测人群的特点进行人性化编排。测试设计问题包括:题型种类的混杂,题型设计过渡性不佳,题型设计的真实性构建欠缺以及题型的功能性缺失。

1.题型种类混杂

陕西省高考口试的混合型题型设计具有不合理性。根据题型种类,可见陕西省高考英语口试的设计类别为混合型,即包括结构型口语测试、交际型测试及任务型测试内容。这样的混合型设计虽然具有一定的好处,例如对于受测学生语言各个层面的全方位考查等,但是也具有显而易见的弊端。不同类型题目评分标准的衡量角度是不同的,例如结构型测试题目对于语言的准确性、连贯性等进行判断,交际型测试题目又从语言对于交际的功能性方面进行判断,而任务型测试主要考查学生对于语言任务完成的情况,从综合层面衡量学生的整体表现情况。因此整套试题的评分标准欠缺一致性。

2.测试题型设计过渡性不佳

题型设计过渡性不佳问题主要体现在测试第一题。根据以上对陕西省2016年高考口试500名学生的记录发现215人明显表现出紧张状态,如此大比例的学生出现紧张状况,部分原因在于学生的“第一次”经历。然而除此之外,通过测试观察,多数出现紧张情绪的学生并不能在第一题进行中或者进行后症状有所缓解,这一定程度反映出题目设计过渡性存在问题。陕西高考口试题型,第一题为段落朗读,通过测试教师口述题目要求的方式进行。考生刚进入考场便听到“Please read the following paragraphs!”的命令性指示,这对于缓解考生的紧张情绪毫无帮助,反而在一定程度上加重了考试的严肃性,使考生更加紧张。

3.题型设计真实性不足

参与测试学生对于题目不理解的问题比较严重。有超过四分之一的学生对题目出现理解问题。且分项数据反映出,此类问题多数出现在测试的第二类题型:情景对话,其在“题目不理解”问题中占比高达86.50%。

所有测试学生中,437人的回答过于简单,占到总学生人数的87.4%。三种题型中,第二题和第三题均有一定数目学生不能达到测试要求的表述量。尤其是第二题,317名测试的考生在这一题目中做出了几乎无效的回答。如此的学生表现反映出此测试题型的效度不佳。这样的回答不能为测试教师提供足够的参考信息以进行客观科学的口语评分,因为学生的表述不足以反映其口语能力,倒是一定程度反映出其听力能力。

4.题型功能性构建缺失

有317名和113名学生对第二题和第三题的问题回答无效。此问题是因为题目设计的功能性缺失,即题目不能有效地发挥引导学生思路的提示性功能,尤其是这类问题在第三题的表现。陕西省高考口试的第三题型仅仅通过教师口述题目的形式对学生进行简单的要求和提示,缺少话题阐述内容的相关提示。不符合受测学生的实际英语水平。

综上所述,陕西省高考口试题型设计出现各类问题。属结构型测试的“段落朗读”题型被置于测试初始位置,较为突兀,缺乏合理的过渡,不利于缓解学生的紧张情绪。交际型测试的“情景应答”题型设计形式对于所建立的情景真实性有所损害,导致学生对于题目及其要求出现不理解问题,且容易出现回答量过于简短及无效回答的情况。任务型测试的“话题陈述”题型缺乏功能性,不能有效地帮助受测学生展开思维,以至于学生往往无话可说及表述不连贯等问题。

结 语

总结而言,无论就客观条件还是受测主体而言,高考英语口试都是一项具有独特性的专项测试。为符合提升测试准确性,协助考生发挥其自身英语口语水平的原则,测试设计者应当充分考虑应试主体的自身特点,根据容易影响学生正常水平的问题合理构建测试形式,尤其是注重学生心理、测试真实性及功能性方面的提升。同时设计者还需要考虑到考试的客观条件限制,做到主客观因素协调,最大限度地还原学生测试场景下的真实英语语言能力。本研究是人性化语言测试理念的一次具体研究,然而其仍需后续进一步探讨,例如后期实证研究,进一步量化、验证人性化口语测试设计的信度和效度等。

参考文献:

[1]邹申:《语言测试》,上海外语教育出版社,2012。

[2]刘润清、韩宝成:《语言测试和它的方法》,外语教学与研究出版社,1991。

[3]Weir, C. J:Language Testing and Validation: An Evidence-Based Approach,(UK: Palgrave Macmillan, 2005).

[4]Anastasi, A:“Evolving concepts of test validation”,Annual Review of Psychology, 1986(37):P1-15.

[5]韩宝成:《语言测试的新进展:基于任务的语言测试外语教学与研究》,《外语教学与研究》2003年第5期,第352-358页。