中国少数民族汉语水平等级考试的历史沿革与使命担当

发布时间:2021-06-28 08:25:23   来源:自考网
原文刊载于《中国考试》2021年第7期第56—62页。
作者
彭恒利,北京语言大学语言科学院研究员。
摘要
中国少数民族汉语水平等级考试(MHK)是目前国内面向少数民族的唯一的国家级语言类标准化考试,其创立和发展体现了中国共产党对民族教育的高度重视。梳理MHK的历史沿革和在考试科学化发展方面的探索,提出MHK在新时代要顺应民族教育的发展要求,顺应学生个性化的发展需求,顺应考试智能化的发展趋势,肩负起加强民族地区国家通用语言文字教育的使命,为提升少数民族劳动者的综合素质和职业竞争力作出贡献。
关键词
中国共产党;中国少数民族汉语水平等级考试;考试科学化;教育公平
正文
中国少数民族汉语水平等级考试(MHK),是专门为测试少数民族国家通用语言文字学习者的学习水平而设立的国家级标准化考试。自2001年启动,经过20年的发展,得到社会的广泛认可,已成为国内特别是少数民族地区的考试品牌。MHK的创立和发展体现了中国共产党对民族教育的高度重视,对民族地区教育评价改革的倾心。在新时代,民族教育面临着新形势、新任务、新要求,为了全面加强少数民族地区国家通用语言文字教育,有必要对MHK的发展历史、理论与实践探索进行系统地回溯和总结,以便更好地肩负起时代赋予的使命。
1 MHK的历史沿革
1.1 研发背景少数民族的语言教育问题,特别是“双语学习”和“三语学习”问题,是一个国际性的难题。新中国成立以来,中国共产党和历届政府都非常重视少数民族和民族地区的教育问题,重视少数民族地区国家通用语言文字的推广。由于历史、自然等原因,民族教育发展仍面临一些困难和问题,不少地区的少数民族群众,虽然学习了多年的国家通用语言文字,但依然张不开口,写不了成篇的文章,这反映出教学效果偏低。   为了提高少数民族地区的教育质量,党和国家在区域发展总体战略中,把民族教育摆在重要位置,采取特殊支持政策,加大各项政策对少数民族和民族地区的倾斜力度[1]。特别是近几年,国家先后印发《关于加快中西部教育发展的指导意见》《加快中西部教育发展工作督导评估监测办法》《关于加快发展民族教育的决定》等文件。内蒙古、西藏、新疆等省份也出台地方性的法规,对发展民族教育、大力推广国家通用语言文字、科学保护少数民族语言文字作出具体规定[2]。这就使国家通用语言文字的推广工作有了法律保障和政策指导。
为了帮助少数民族找到一条有效的学习掌握国家通用语言文字的道路,教育部民族教育司进行了积极探索,摸索出先学习借鉴,后独立发展的经验。从1997年开始,先后在新疆、吉林等省份进行中国汉语水平考试(HSK)的试点。几年的探索表明,HSK的试行对少数民族地区国家通用语言教学产生了积极影响,促进了语言教学模式的转变,逐步走上了注重交际能力培养的道路。但在试点中也发现,HSK存在一些不适应少数民族语言学习的方面,如在广泛使用的HSK初、中等考试中没有包含写作和口语,不符合少数民族地区国家通用语言教学的要求;在试题语料的选择上,主要考虑的是适应外国人学习汉语的特点,语料成人化,不能很好地反映少数民族学生学习国家通用语言的需求,不能适应少数民族青少年语言学习的特点等。   为了满足少数民族地区语言教学的需要,建立适合少数民族学习国家通用语言的科学评价体系,全面推进教学改革,以提高少数民族实际运用国家通用语言的能力,适应生活、学习、工作和社会交往的需要,教育部民族教育司经过认真调研之后,2001年4月正式启动MHK的研制工作。
1.2 MHK的发展根据《教育部关于在有关省区试行中国少数民族汉语水平等级考试的通知》,从2003年起,MHK开始在吉林、青海、四川、内蒙古、新疆等省份推广,广泛用于高考、中考、社会化考试、学业水平质量监测等领域,截至2020年底,考生人数累计超过290万人次。从MHK的工作重心、研究内容进行纵向回溯,其发展大致可分体系建构、试行推广、快速发展3个阶段。
1.2.1 体系建构期:2001—2004年   这一阶段是项目的初创阶段,重点是体系建构,以考试大纲编制为要。考试大纲的编写工作从2001年5月开始,历时3年完成。围绕考试的开发,以框架设计和题型设计为研究重点,并对测验的长度、及格线的设定等进行了探索。框架设计方面的研究主要有:MHK的理论框架、口语考试的可行性分析、词汇等级大纲的编制、分界标准确定方法综述及测验长度确定的理论与方法等;题型设计方面,主要围绕听力考什么、MHK三级听力理解命题、阅读理解命题、书面表达题型设计、排列句序题测查能力的分析等展开[3]。   2003年11月,吉林、青海2省先后出台在少数民族学校试行MHK的文件,2004年进行用三级考试成绩替代高考汉语成绩的试点。此外,延边大学和中央民族大学还进行了四级考试试点。
1.2.2 试行推广期:2004—2012年   2004年3月,随着4个级别的考试全部推出,MHK步入试行推广期。2012年,新疆全面实现了由HSK到MHK的过渡,HSK正式退出新疆少数民族考试领域,标志着MHK顺利完成试行任务,步入新的发展时期。这一时期,实证研究和体系的规范化成为研究重点,研究的内容也明显扩大,涉及测验长度、及格线、效度、等值、公平性、主观题评分、认知诊断、学业水平质量监测等领域[4]。   这一时期,四川、内蒙古、新疆也先后出台试行MHK的文件。为了试行工作顺利开展,民族教育司的时任领导还带队赴内蒙古、新疆进行调研、试测,召开现场办公会解决试行工作中遇到的政策和技术问题。之后,MHK4个级别的考试在有关民族地区全面铺开:一级主要用于青海、新疆的学业水平质量监测;二级除用于青海的中考外,还用于新疆和西藏的学业水平质量监测;三级替代高考汉语的试验扩大到四川和内蒙古,新疆委托课题组参照MHK题型结构命制高考汉语试卷,同时还在北京邮电大学、中央民族大学、青海师范大学等高校试行;四级的试行范围进一步扩大,由北京、吉林、青海扩展到内蒙古、宁夏、江西、新疆等省份的几十所高校。这一时期,MHK口语测试进行了多次大规模试测,并实现了由档案式评价到基于人工智能与语音识别技术“人机对话”式测试的转变。
1.2.3 快速发展期:2013年至今   随着汉语课程标准的修订,2012年底,MHK大纲修订工作启动。通过大纲的修订,MHK实现了自我完善和自我超越,进入快速发展期。   MHK大纲修订包括2个方面:一是对考试大纲的结构和内容进行补充和完善。主要对等级标准、各级大纲的结构和题型进行调整和修订,更换和调整样卷,增加样卷解析。二是对汉字和词汇进行修订。改变字词表的等级序列名称,使之与考试等级对应;调整各级别汉字和词汇的数量,汉字在保持3500个总量不变的前提下,增加小学一至三学段的识字量,减少初中第四学段的识字量;4个级别的词汇量均有不同程度的增加和调整,总词汇量由10125个增至10569个。围绕考试大纲的调整,这一时期的研究针对考试中出现的新问题、新趋势进行,重点围绕主观题的自动评分、题库与自适应性测验、主观题的等值等展开。   这一时期,随着MHK在新疆的全面铺开,考试人数、考点数快速增长,并在2018年达到峰值。
1.3 MHK的作用和意义MHK的研发有着深刻的时代背景,它融汇了第二语言教学、双语教学特别是国内外语言测试的最新研究成果,顺应了少数民族地区日益高涨的对国家通用语言文字学习的需求,反映了全面推行素质教育的要求。MHK20年来的发展历史,是中国共产党对民族地区关怀、关心的发展历史,是少数民族普通百姓享受党的民族政策阳光普照的历史。   MHK的积极作用主要体现在:一是建立了一个适合国内少数民族学习国家通用语言文字的国家级科学评价体系。化区域为整体,化分散为统一,使民族地区国家通用语言文字的评价聚合在一个量尺下,加大了民族地区国家通用语言文字推广力度,推进了民族地区国家通用语言文字教学的改革,对民族教育的发展起到了促进作用。二是促进了教学理念的转化,提高了少数民族国家通用语言文字学习者的应用水平。谢小庆认为,MHK的一个突出特点就是不以任何特定教材为依据[3]。MHK遵循考教分离的原则,认为教学有自身的规律,考试不能干扰教学,要服务教学;考试可以反馈教学,但不能替代教学,否则就会走上应试教育的老路,违背考试研发的目的。三是促进了教育公平,助推少数民族学生实现上名校的愿望。由于实行了MHK,少数民族学生可以通过预科的方式,摆脱过去只能选择语言类专业的限制,选择热门专业、选择名校,真正实现了习近平总书记提出的“全面实现小康,少数民族一个都不能少,一个都不能掉队”的愿望。四是普及了标准化考试理论和理念。MHK的研发团队是一个开放性的团队,会聚了语言学、教育测量学和少数民族地区语言教学的专家,专兼结合。MHK在研发过程中,通过座谈会、研讨会、讲座等形式,传播了标准化考试的理论,使少数民族地区的教师熟悉标准化考试的理念。谢小庆认为,MHK是一个考试推动素质教育的成功范例,是一个应试教育与素质教育得到统一的成功范例,代表了今后中国考试改革和教育改革的方向[4]
2 MHK在考试科学化方面的探索
MHK研发伊始,在重视命题、考试推广的同时,也非常重视考试本身的科学化建设,开展了多维度、多角度的理论探索和实证研究,主要包括考试分数的连接和等值、试题公平性分析、主观题的评分误差控制等;此外,还围绕题库建设及多阶段自适应测试、主观题的等值与连接、主观题的计算机自动评分、学业水平质量监测以及计算机辅助命题等展开了研究。
2.1 题库与自适应考试题库建设是实现计算机化测试、计算机自适应测试的基础。MHK研发伊始,就非常重视题库建设,并在2018年初步建立了MHK(三级)客观题题库,完成统计参数标定工作;并以此为基础,开展了基于题组反应理论的题库建设及多阶段自适应测试的可行性研究[5],计算机多阶段自适应测试若干关键技术研究[6],多阶段自适应测验结构设计的影响因素研究[7]。这些研究目的性很明确,主要是探索将多阶段自适应测验应用于MHK考试的可行性。
2.2 等值与分数连接等值是测验公平性的保证,是题库建设的基础和实现计算机化考试的前提。MHK关于等值研究的成果主要有:主客观组合试卷的分数连接研究[8],主观题分数等值连接可行性探究[9-10],主观题评分员效应的控制与调整研究[11],MDIA方法下对MHK(三级)口试分数连接的探索[12],基于项目反应理论和题组反应理论的等值研究[13],等等。   根据教育部的部署,2011年,MHK的一、二级考试用于青海、新疆的学业水平质量监测。为了检验新疆双语教育的教学效果,MHK开发了小学四年级和五年级的试卷,并连续3年对同一样本进行了纵向跟踪研究,为此专门开展了纵向量表化[14]和增值评价研究[15]
2.3 主观题的评分及计算机自动评分主观题存在评阅耗时长、效率低和误差大等缺陷,为解决这些问题,实现计算机自动评分,国内外的考试界都做了许多探索。据Ramineni等的调查,目前至少有10种以上的主观题自动评分系统[16]。   实际上,主观题评分研究涉及的内容和领域非常广,包括评分的信度、效度、评分效应、评分模式、自动评分、人机评分对比等,其中自动评分研究是热点。MHK在这些方面均开展了研究。关于主观题的自动评分,MHK从作文和口试2个方面进行了深入探索,并将阶段性成果应用于实测。MHK作文自动评分前期研究主要是探索自动评分的可行性,后期研究扩展到汉语作文计算机自动评分高分段趋中评分控制研究[17],汉语作文计算机自动评分雷同卷的评分研究[18],基于多面Rasch模型的作文网上评卷“趋中评分”判定研究[19],主观题网上评阅趋中评分控制研究[20],等等。   重视被试口语能力的测评是MHK的特色,MHK的4个级别均设有口语测试。经过多年的探索,MHK的口语测试实现了从档案式到基于人工智能与语音识别技术的“人机对话”式的跨越,研究涉及考试方式、效度分析和评分模式[21-27]等。   综观国内外的自动评分研究,在评分技术上虽然取得了重大进展,但仍有很大的发展空间。国外在大规模高风险考试中使用自动评分技术较为谨慎,国内则呈现出起步晚、发展快的趋势。MHK口语的朗读、封闭性问题的研究成果已应用于实测,开放性试题也做了多次大规模的实验研究和对比分析,取得了突破性进展,相信在不远的将来可用于实测。
2.4 计算机辅助命题技术目前,计算机已可以进行自动组卷、评卷等工作,但在命题上的应用还较少。由于人工命题的成本较高、效率较低,如何利用计算机自动筛选可用于命题的文本,提高命题效率成为目前考试界关注的一个热点。   为了解决MHK命题文体筛选的难题,研究人员参照ETS自动命题系统SourceFinder的研究成果,结合少数民族学习国家通用语言文字的特点,建立了适用于MHK(三级)的阅读理解命题文本自动筛选模型,包括长度筛选、禁忌话题筛选、可用性概率计算3个模块。为了检验模型的性能,用2541篇文章对模型进行了检验和测试,结果表明,研究的思路和方法可行,前景可期[28]。计算机辅助筛选测试文本在国内外都属于比较新的领域,研究人员不多,研究成果离预期还有一定的距离,但这一领域的探索无疑是具有积极意义的。
3 MHK的未来展望
MHK经过20年的发展,逐步走向成熟,科学测评的理念得到传播,先进的考试技术得以广泛应用,考试理论的探索取得长足进步,影响力越来越大,已在国内标准化考试之林站稳了脚跟。同时,也应清醒地看到,MHK现行的考试标准、考试内容有些已不能适应加强民族地区国家通用语言文字教育的有关要求和少数民族学生、群众学习掌握国家通用语言文字的需要,改革创新时不我待。展望MHK的未来,至少有3个趋势需要把握。
3.1 顺应新时代民族教育的发展要求当今世界正经历百年未有之大变局,中华民族伟大复兴也处在关键时期。为了加快少数民族和民族地区教育发展,实现国家长治久安和中华民族繁荣昌盛,实现中华民族伟大复兴的中国梦,要求我们要改变旧的观念,与时俱进。MHK在未来的发展中要以中华民族共同体意识为主线,落实立德树人根本任务,注重民汉兼通人才的培养。虽然在功能上依然还要发挥语言测试的基本作用,但在测试内容的选择上要提高政治站位,充分发挥考试评价的引导作用,以全面加强少数民族和民族地区国家通用语言文字教育为使命,将习近平总书记关于“五个认同”“三个离不开”“四个共同”的重要论述和中华优秀传统文化、革命文化融入其中,引导少数民族群众树立正确的祖国观、民族观、历史观、文化观,构筑各民族共有的精神家园。同时,要进一步完善考试评价体系建设,建立少数民族群众学习国家通用语言文字的科学评价体系,增强少数民族群众学习、应用国家通用语言文字的动力,不断提升少数民族群众的综合素质和走向社会、参与社会生活的能力和职业竞争力。
3.2 顺应学生个性化的发展需求Bennett在论述教育测量的未来趋势时,提出以技术为依托,测量“新”构念,建立在更新层次认知和学习模型的基础上,更“个性化”[29]。刘欧在谈及教育测试的国际趋势时指出,对教育成功认识的转变促使测试内容有新拓展,个性化学习对测试提出灵活性的需求[30]。2位专家的论述都谈到了个性化,也就是说,个性化测量在未来将是刚性需求,这也正契合了民族地区差异化的发展需求。MHK如何顺应这个需求?需要解决的问题有很多,包括观念、技术、心理等多个层面、多个维度。首先要解决的是观念上的问题。众所周知,现在通用的大规模标准化测试是忽略或抹杀个性的,是不利于创新意识的培养的。要实现真正的个性化测试,就要突破传统标准化测试的束缚,在考试内容、考试方式上进行变革,目前至少有2个方向可以尝试,一是使用计算机自适应性考试,二是与认知理论相结合。教育测量的目的不应只限于评价,更应发挥诊断的作用;不应仅限于向考生提供笼统的总分,更应该关注考生的作答过程,并向考生提供针对性强、个性化的诊断报告和改进方案,这也是少数民族学习和掌握国家通用语言文字最需要的。为此,要做一些基础性的工作,如构建能力量表及描述语库,进行分数报告的改革等,在报告总分和单项分的同时,给出能力诊断、评价信息、改进建议和学习指导,指导少数民族学生查漏补缺,事半功倍地提高学业能力,并为学校和教育主管部门提供更为丰富的评价信息。
3.3 顺应考试智能化的发展趋势现代心理和教育测量的一个显著特点就是与计算机技术的深度融合,不仅是信息采集、考务管理、阅卷评分等的计算机化,在考试方式上也在广泛地使用计算机技术。随着计算机技术的变革,量子、纳米技术的突飞猛进,使计算机具有了感知、思考、判断、学习及一定的自然语言能力,加上云计算技术的应用,光互联网的快速发展,人工智能技术对考试测评领域将产生巨大影响,一些无法实现的测试方式将会变成现实,测试将向多元化、综合性、智能化发展。MHK又将如何顺应?基于少数民族教育和民族地区发展的现状,MHK要充分利用计算机技术给予的高平台,充分利用人工智能、大数据、虚拟现实技术,在广泛使用自动评分技术的同时,积极开展听力文本自动录音技术、计算机自动命题技术、测试文本自动筛选技术、雷同卷甄别技术的研究与应用。只有这样,才能更好地为少数民族和民族地区服务,使其教育水平得到显著提升。
参考文献
推荐文章