系统调整:语文教育评价对核心素养发展诉求的回应
2001年,我国启动了第八次基础教育课程改革。伴随2017年版普通高中课程方案和各学科课程标准的颁布,我国迈入了“全面深化基础教育课程改革” 的阶段。这一阶段的课程改革,最为突出的标识是将“课程发展的逻辑起点”由“学科内容”调整为“核心素养”。
当下和未来较长一段时间里,如何让“中国学生发展核心素养”和 “学科核心素养”落地,是我国基础教育领域的重大课题。其中,“通过教育考试和评价改革,促进核心素养的落地是关键环节”。的确,无论是从 “课程目标、课程内容、课程实施、课程评价” 这样的课程要素构成来看,还是从既有的经验和教训来看,这一轮基于“核心素养”的课程改革,如果没有与之匹配的评价体系,那么“核心素养”可能沦为一时的热词。因此,在探讨核心素养语境下如何“教”的同时,必须深入思考核心素养语境下如何“评价”的问题。
一、“核心素养”语境下语文教育评价需明确的前提认识
核心素养的提出,自然地会给语文教育评价带来一些新的问题,譬如“一般核心素养测评和语文学科核心素养测评是什么关系” “语文学科核心素养是否可以直接测评”等。对此,可以作出如下回答。
(一)一般核心素养测评和语文学科核心素养测评可分可合
从目前既有的理论和实践来看,一般核心素养的测评有两种情况:一是专门测评一般核心素养;二是一般核心素养与其他课程整合在一起测评。前者如国际学生评估项目(Program for International Student Assessment,PISA)在阅读、数学和科学测评之外,有专门的“问题解决”(2012)和 “合作问题解决能力”(2015)测评;后者,一定程度上需要各课程领域根据课程特色,自觉地整合考虑。我国《普通高中语文课程标准(2017版)》(以下简称《课程标准》)“评价建议”中指出“评价时要充分考虑语文实践活动的特点,注意考查学生在活动中表现出来的参与程度、思维特征,以及沟通合作、解决问题、批判创新等能力……”这样的建议便是在语文课程测评中适时关联一般核心素养。本文所说的核心素养语境下的语文教育评价,是立足语文课程,在语文学科核心素养测评中有机关联一般核心素养要素。
(二)语文学科核心素养依然要通过语文学习活动来考查
在“学科核心素养”的界定和阐释中,《课程标准》指明:“语文学科核心素养是学生在积极的语言实践活动中积累与构建起来,并在真实的语言运用情境中表现出来的语言能力及其品质。”“课程目标”部分,《课程标准》的相关表述为:“学生通过阅读与鉴赏、表达与交流、梳理与探究等语文学习活动,在语言建构与运用、思维发展与提升、审美鉴赏与创造、文化传承与理解几个方面都获得进一步的发展……”“评价建议”部分,《课程标准》指明:“……应围绕阅读与鉴赏、表达与交流、梳理与探究等学习活动,在具体的语文学习情境和活动任务中,全面考查学生核心素养的发展情况。”概括而言,语文课程中,学生一般核心素养、语文学科核心素养,还是需要通过“阅读与鉴赏、表达与交流、梳理与探究”等语文学习活动考查的。
明晰了以上两个前提认识,便可正式启动思考核心素养语境下语文教育评价应如何调整。
二、语文教育评价系统调整的框架和思路
为了取得可见的实践效果和获得可持续性发展,核心素养语境下的语文教育评价需作出系统调整。其间有两个要点:一是从全局出发形成调整的“系统框架”;二是各个环节、局部的“调整思路”都要有针对性。
“系统框架”需兼顾当前语文教育评价改革的需要与评价领域的常规问题(或基本环节)来确立。无论何时,“评价”总会涉及“评价什么” “如何评价” 这样的基本问题。其中,“如何评价”又包括中观的“评价途径和类型”与微观的“任务设计、实施和反馈”两个层面。核心素养语境下的语文教育评价,也需要从这些角度考虑应作出哪些调整。“调整思路”可以通过比较核心素养理念下的培养目标和当前语文教育评价的现状,明确语文教育评价各环节需要调整的内容、方向。
综合而言,当前语文教育评价可关注图1所示的系统调整框架和思路。以下逐一探讨各层面的实践切入点。
图1语文教育评价系统调整的框架与思路
(一)充分理解和全面考虑评价“领域”
“测量的第一个阶段,要回答一个问题:‘我们测量的是什么’?我们需要用一个‘标签’来识别‘构念’(construct)。更重要的是,我们需要为这个‘构念’界定‘领域’(domain),即根据关于这个‘构念’的理论和相关知识识别一些可操作的指标(operational indicators)。”对于我国目前的语文教育评价来说,测量的“构念”可指向语文学科核心素养;我们可以为其界定的“领域”,即“一些可操作的指标”可包括“阅读与鉴赏、表达与交流、梳理与探究”(高中),或“识字与写字、阅读、写作、口语交际、综合性学习”(目前义务教育课程标准中的学习领域)。到这一步,操作性还不够,还要为阅读、写作等领域找到更加具体的操作指标或任务设计的切入点。
根据测量理论,测量“领域”的选择和理解至关重要,这会影响测量的内容效度和结构效度。从这个意义上讲,核心素养语境下,测评什么和不测评什么需仔细推敲,这直接关涉所测评的是不是学生核心素养的相关表现。
反观实践,在测评领域的选择和理解上,存在着一些差异和落差。譬如,以2018年我国东西南北中16个地区的语文中考试题来看:有4份试卷不考名著阅读;有4份试卷考到了名著阅读,但只考信息记忆;有4份试卷兼顾考查名著阅读中的记忆和理解能力;有4份试卷中的名著阅读题则专门考查理解或理解以上层级的能力(注:与地区发达与否没有必然关系)。再如,有些地方规定写作只考记叙文写作,有些地方会考到不同文体。这些差异汇总起来,就代表了对测量“构念”不同的理解,对测量“领域”不同的选择和理解。部分选择,恐怕与语文学科核心素养、核心素养这些“构念”并不匹配。高考语文(全国卷1)文学类文本阅读和实用类文本阅读由选考改为必考,则反映了对语文测量“构念”和“领域”的认识在发展。当下,根据对核心素养、语文学科核心素养的理解,结合国际测评经验,有必要从不同角度思考语文测评“领域”。
其一,原本被边缘化,但核心素养语境下需重视的部分。譬如,口语交际。进入21世纪,各个国家和地区在制订核心素养体系时,不约而同地高度重视沟通交流能力。沟通交流能力主要对应于母语课程中的口语交际能力,各个国家和地区的母语课程标准对此都有具体、详细的要求。纵观我国语文课程发展史,语文教学大纲或课程标准层面一直都有关于听说或口语交际的相关要求,但口语交际教学一直处于语文教学实践的边缘。当下,重视口语交际,既符合语文学科本体规律,又能呼应核心素养培养要求。2017版高中语文课程标准中的学业质量标准,虽然篇幅有限,但还是有关于口语交际的学习结果要求:能敏锐地感受交际对象的语言特点和情感特征,迅速判断其表达的正误与恰当程度,察觉其言外之意和隐含的情感倾向;能根据具体的语境和表达的目的、要求,运用口头语言,文从字顺、准确生动地表达自己的真情实感。乐于与他人分享自己的学习经验……。这是四级水平中的要求,是高校考试招生录取的要求。然而现实中,学生不敢交流、不善交流的情况还较为普遍。因此,核心素养语境下,应该给予曾经被忽视的口语交际教学和评价更多的关注。
其二,原本就有,但可以略作调整、拓展的部分。譬如,阅读后的写作。已有的相关实践主要是为了引导学生积累写作素材或借鉴所读文章的写法,以促进写作。这样一种取向本身是有意义的。不过我们不能忽略部分学生写作中存在的这样一种现象:追求好词好句,追求“旁征博引”,却不善于好好分析、说理。对此,我们不妨重视另一种取向的“读写结合”,即通过写来表达对所读内容的理解、思考、评论等。在2017版高中语文课程标准中,每一个任务群的学习要求和教学提示中都提出了“写作”要求,具体形式有:写概要或提要、读书笔记、作品评介、调查报告、文学评论、学术性小论文等。这些内容需要引起我们的重视。这一类任务,可以从不同角度观察到学生阅读、写作以及批判性思维能力的发展情况。这一脉的“读写结合”,在国外被称为“通过写作学习” (writing to learn)或“实质性写作”(substantive writing)等。
其三,原本没有正式提出,需要新研究的测评“领域”。譬如,整本书阅读、思辨性读写等。对于这些较新的“领域”,首先,要加深对这些“领域”的内涵、目标的理解,“在教师开始评估学生的批判性思维能力前,他们自己先要有这些能力。否则,他们没有立场来评估他们学生的思维。”其次,要考虑这些新领域如何和已有的阅读、写作等测评领域融合。
以上从三个方面谈了如何通过精选和深入理解测评“领域”来尽可能逼近“核心素养”取向的评价。不过,这里所提及的一些测评“领域”,可能超越了我们印象中的“考试”范围;按照这样的思路,也许我们的“考试”会不堪重负;有些内容,现在似乎也不具备考试的条件。事实上,核心素养语境下,语文教育评价改革需要走出狭隘的“考试”意义上的评价观,同时丰富对于“考试”的认识。
(二)有针对性地选择和规划评价类型
核心素养或学科核心素养“是复杂的理论,对既有测评理论和实践提出了严峻的挑战”。对于这样难测的“构念”,克服困难的途径有两条。一是研究并发展纸笔考试,精心选择测试领域,精心设计题目。这一方面,高利害考试命题者和测量与评价领域的研究者正在努力推进。二是广大语文教师可在日常教学中扎实地丰富评价的途径和类型。
2003版高中语文课程标准和2011版义务教育语文课程标准中早已提出应恰当运用多种评价方式,只是没有达到期待的实践效果。在当下核心素养语境下,它们又赢得了人们的高度关注。当然,此时的关注会有些更加明确的着力点。
1.进一步加强形成性评价在评价体系中的地位
美国在2010年颁布各州共同核心标准(Common Core State Standards, CCSS)后,联邦政府共拨款3.62亿美元给两个评估联盟,即“大学及职业准备评价合作伙伴”(Partnership for Assessment of Readiness for College and Careers,PARCC)和“智慧平衡评价联盟”(Smarter Balanced Assessment Consortium,SBAC),要求他们制订基于CCSS的学业评估体系。其比较突出的一个共同点是都承诺“评估体系将由一种用于问责目的的总结性(年末)评估和用于整个学年的形成性评估组合而成”。从我们的视角来看,相对于中高考这些高利害、选拔性考试而言,这里所说的学年末的总结性评估和贯穿学年的形成性评估,都是广义的形成性评估。美国通过形成性评估来落实基于美国“21世纪技能”(可以理解为美国版核心素养)的新课程标准CCSS的力度,由此可见一斑。
为什么要如此重视形成性评价?测量与评价领域,基本已经形成了定论,形成性评价和终结性评价,有着各自的功能,任何好的评价方案都需要这两种评价。这本是评价实践领域应有的常态。在核心素养语境下,更需要兼顾这两类评估,因为素养的形成是累积的过程,需要长时间、多角度的观察。
反观实践,似乎我们日常教学中从来不缺“评价”,不过日常评价很多时候是高利害性质的终结性考试的“附庸”。核心素养语境下,形成性评价需要丰富样式。