李吟霁 彭虹斌
正如瑞典学者埃弗特·韦唐提出“评估是对政府干预的行政、产出以及结果的优点和价值进行仔细的回顾,以在未来的实际行动情况中发挥作用”[1],教育政策评估是保障教育政策科学性和有效性的重要环节。自20世纪40年代美国政治科学家哈罗德·拉斯韦尔提出政策科学的概念之后,西方开创了政策研究之先河。而被称为“评估之父”的拉尔夫·泰勒于1942年出版“八年研究”的报告,开创了以描述为特点的评估范式[2](P7)。至1966年詹姆斯·科尔曼等发表《教育机会均等》报告,教育政策评估已成为西方重要的研究领域。
我国教育政策研究自新中国成立以来经历了“基本完成社会主义改造”时期、“全面建设社会主义”时期、“*****”时期和社会主义建设新时期。历经“**”后,我国教育政策研究出现了“断层”现象。1983年,邓小平提出“教育要面向现代化,面向世界,面向未来”,这“三个面向”成为我国改革开放以来制定教育政策的指导方针[3]。我国教育政策评估自发展之初,虽已经向当时相对成熟的西方教育政策评估体系学习,但较之于教育政策制定、执行等,仍是教育政策研究领域相对薄弱的环节。因此,它更加需要学习和借鉴成熟的理论来弥补不足,推动教育政策制定、执行和评估的良性循环发展。然而,当前我国教育政策评估研究发展过程中面临的最大困境是“如何更好地构建具有中国特色的教育政策评估研究体系”,也即教育政策评估研究的“本土化”问题。西方教育政策评估理论虽然可以用来指导我国实践,但由于我国特有的政治体制背景、自上而下的政策实施逻辑以及丰富的人文环境、多元的本土思维意识,决定了外来理论体系及其逻辑方式未必适应我国国情,生搬硬套将不利于我国教育政策评估科学化研究体系的建立。
“本土化”的教育政策评估研究具有主体性、互动性和非功利性特点,具体体现为以基于本土人文的评估为主体,能够与环境互动、与实践互动,研究内容客观且开放。教育政策评估研究“本土化”要求我国学者在研究中运用中国的思维方式去思考问题,所采用的概念、理论、方法等能够充分代表、反映或者揭示那些根植于中国本土情境中的元素,并能基于文化自觉和语言自觉进行知识生产和理论创新[4]。具体而言,就是将西方教育政策评估理论通过“精加工”,使之符合中国的实际,再由内而外生成本土的概念、理论与方法,通过“本土化”实现本土思维和外部理论二者的兼容。一方面,要识别西方外来理论的局限并加以改进;
另一方面,要防止陷入本民族思维意识陷阱,最终通过教育政策评估研究的“本土化”,发展具有本土话语、本土思维、本土逻辑的教育政策评估分析理论和框架,获得本土心理认同,扎根民族环境,实现科学的评估以及在中国本土情境中实现理论的发展与创新。本文将在推演我国教育政策评估研究的历史进程的基础上,以高等教育政策为主要研究对象,着重关注我国教育政策评估研究“本土化”进程的困境并探索未来发展路径。
结合我国社会发展以及教育政策研究的发展逻辑与特点,我国教育政策评估研究自改革开放以来的发展大致可划分为萌芽初创、模仿借鉴、实践探索以及本土建构四个时期。
其一,萌芽初创期(20世纪80年代初期—1994年):萌生评估意识。我国的教育政策评估研究萌芽于20世纪80年代初期。当时我国教育政策学尚处于发展初期,作为教育政策学分支的教育政策评估研究并未引起广泛关注,不过政治学作为政策科学的母体学科在发展过程中讨论的一些概念开始涉及政策评估相关的重要基本概念。这一时期,虽然“教育政策学”的概念没有明确,也没有“评估”的具体方法,但国家对于相关教育政策的评估工作一直都在进行,如对1985年中共中央公布的《关于教育体制改革的决定》的多次修改,对1986年颁布的《中华人民共和国义务教育法》执行情况的检查等,每一次修改和检查都要历经众多座谈会,广泛征求各界人士的意见,已经初具教育政策评估雏形[5]。这一时期没有系统的教育政策评估理论知识,也缺乏专业的教育政策评估方法和标准,仅限于对“教育政策评估”意识层面的萌芽与发觉。因此,此阶段可以视为我国教育政策评估研究的萌芽初创期。
其二,模仿借鉴期(1995年—2009年):理论引进下的本土成长。这一时期,西方发达国家的教育政策评估实证和理论成果已相对丰富,我国学者积极借鉴西方教育政策评估理论并加以探讨。在理论发展方面,1995年,肖远军根据西方理论首次定义了教育政策评估,即“按照一定的教育价值准则,对教育政策对象及其环境的发展变化以及构成其发展变化的诸种因素所进行的价值判断”[6]。1996年,袁振国主编的《教育政策学》出版,这是我国第一本详细论述西方教育政策学学科重要概念和理论的著作。他认为,国外对教育政策制定的专业化和教育政策过程的科学化的重视已有二十多年的历史,但我们所知甚少,所以相关研究在我国会很快发展起来[7]。次年,孙绵涛主编的《教育政策学》出版,对我国和西方发达国家的教育政策进行了比较研究,系统地论述了教育政策的制定﹑执行和评估。2000年起,袁振国主编的《中国教育政策评论》每年出版一期,对国家重要教育政策问题进行评论。2008年,高庆蓬在其博士论文《教育政策评估研究》中,系统探讨了教育政策评估的基本理论问题,试图为教育政策评估实践提供规范的理论指导,并归纳出我国当时研究主要集中的四个方面:一是关于教育政策评估理论的研究;
二是关于教育政策评估方法论的研究;
三是关于教育政策评估具体案例的研究;
四是关于教育政策评估的演进与问题研究等[8]。在研究队伍发展方面,1999年,华东师范大学召开了由教育决策部门﹑教育执行部门和教育科研机构人员共同参与的第一届“教育政策分析高级研讨会”[9](P19-23)。2000年,“我国教育政策与法律研究的回顾与展望”学术研讨会在国家教育行政学院召开,并成立了我国第一个教育政策学研究与交流的民间学术团体——“全国教育政策与法律研究专业委员会”[10]。2006年,国家教育督导团发布《国家教育督导报告》并形成制度,提出将充分发挥教育督导的“督政”职能,围绕教育的重点工作进行全面、客观的分析和评价[11]。这一时期,在领军人物的带领下,我国“教育政策评估研究”初具形态,教育政策评估的基本概念和理论逐渐得到明确,也确立了相关研究组织和机构。但是,“与学生评价、教师评价以及学校办学水平评价相比,教育政策评价还相当薄弱”[12],研究机构和队伍也较为简单。
其三,实践探索期(2010年—2016年):遇到引进理论与本土研究不适应的问题。这一阶段的教育政策评估研究主要集中于四个方面:一是关于教育政策评估内涵要素的研究;
二是教育政策评估实践应用研究;
三是教育政策评估经验的国际比较研究;
四是对于构建符合我国特色的教育政策评估体系的研究。2015年,贺武华主编的《中国教育政策过程本土化研究》一书出版,探讨了教育政策研究的本土化问题,揭示了我国教育政策研究的现状并寻求有“中国国情特色”的教育政策本土化研究,从中国特色社会主义事业、党政关系变量以及价值取向三个维度分析了中国教育政策过程的脉络渊源,论述了中国教育政策过程的特点,并提出了教育政策间性的概念[13],这是对我国教育政策研究“本土化”的创新思考。2010年12月,由教育部与首都师范大学共同组建的中国教育政策评估研究中心成立,开展对我国教育政策热点问题的评估与舆情分析,规范了评估制度,推动了我国教育政策评估实践的深入。2011年,中国人民大学设立“教育法律与政策研究所”;
2012年北京师范大学增设二级学科“教育政策学与教育法学”,推动教育政策学高层次人才培养,也促进了教育政策评估理论的发展。这一时期,由于我国独特的教育政策过程、特有的环境和行为特点,教育政策评估理论研究逐渐暴露出“外来理论”与“本土现象”不协调的问题,很多理论缺乏实践解释力。
其四,本土建构期(2017年至今):探索“本土化”的教育政策评估。2017年,党的十九大报告提出“要夯实教育政策监测评估,推进决策的科学化,提高治理能力现代化水平”,明确指出“教育决策科学化还须政策评估来问诊”[14],将教育政策评估的位置提升到了全新的发展高度。同时,更高层次教育政策评估研究人才的培养也趋于系统化。同年,北京师范大学面向教育政策学与教育法学专业博士研究生开设《教育政策学与教育法学研究前沿》课程,形成面向本科生、硕士生以及博士生一体化的教育政策学与法学专业课程体系。2019年,复旦大学在LSE(the London School of Economics and Political Science,伦敦政治经济学院)建立全球公共政策研究分中心,全面启动复旦与LSE在政策领域的深度科研合作和联合前瞻性研究,以课程的体系化和国际合作为教育政策评估理论研究和科学化实践的发展奠定坚实的基础。同时,开始关注如何定义“好”的教育政策评估研究,指出“好”的教育政策研究既需要有合理的判断标准又需要有边界,同时也需要遵循规范逻辑[15](P14-28)。当前,由于我国教育发展的阶段性和特殊性,教育理论研究与教育政策制定之间存在一定程度的“错位”,导致相关政策迁移到中国之后“水土不服”,教育政策评估研究面临“本土化”的困境。因此,在探索“本土化”教育政策评估问题上,不能只单纯借鉴西方教育政策评估现有理论,更需以其为基础建立本土的话语与理论,健全符合我国自身国情发展的解释分析框架。
“本土化”的教育政策评估研究能够突出地方特点,又独立于本土的人文偏见,具有既贴切又客观的特点。本文将结合中西方的相关特点对我国教育政策评估研究的“本土化”发展困境进行分析。
(一)教育政策评估研究的主体精神被遮蔽
首先,忽略了我国独特的政策实施逻辑,难以学以致用。我国教育体制的总体特征是国务院领导和管理全国教育工作,县级以上地方各级人民政府管理本行政区域内的教育工作,教育治理以运动式治理或专项治理为主。在教育评估方面,实行教育督导评估制度,各级教育行政部门或经认可的社会组织,对学校及其他教育机构进行考核和评定,具有自上而下的行政主导特征[16]。我国的教育政策基于国家教育体制实施,这种体制特征下的教育政策评估统一而集中,体现出更多“官方”的特点。反观西方国家则有把政策过程区分为政治和行政两个阶段的传统认识,即政策制定是政治的,政策执行是行政的,行政阶段就应该“去政治化”。这种政治和行政二分的观点认为,政策制定过程需要集中民众的智慧共同讨论、商议以确保政策的有效与科学,以便到了政策执行过程,行政人员“不需要头脑”去判断去思考政策,只需要按照制定好的政策去实施[17]。由此,西方教育政策制定、教育政策执行以及教育政策评估成为了三个相对独立的板块,各有话语权,从而教育政策评估机构存在许多独立于政府的组织(如兰德公司、布鲁金斯研究所等),能参与政策过程,影响政策决策和评估;
对他们而言,将评估工作交给独立的咨询机构、大学研究人员等是非常正常的事情[18]。而我国的现实是,在不能忽视教育政策评估研究中政府部门位置的情形下,当前教育政策评估过程中部分相关部门参与度严重不足,如在高校扩招政策评估中,作为高校扩招政策制定者的政府部门基本未参与[19](P156),严重削弱了评估结果被采用的几率。因此,如何调整政府部门在评估中的位置与关系是我国当前需要解决的问题。
其次,缺少本土教育政策评估理论体系,陷入为了评估而评估的矛盾。教育政策评估要集中于自身的“评估”职能,需要通过对旧事物的革新和转变、对自身进行改造,实现从“旧”政策向“新”政策的转变,达成改进教育政策的目的。教育政策以人为实施对象,不同的人有不同的价值观念、表达方式以及行为风格,我国对于西方方法和技术的学习和应用需要符合“本土人”的特点。比如,当前对实证主义方法的追捧,于教育政策评估而言,忽略了自由的人性特点,忽视了不同价值主体之间的价值冲突,没有创造出符合“本土人”特点的教育政策评估。再比如,针对我国民族教育政策的评估,相较于我国广泛分布的少数民族群体,我国少数民族教育政策研究主体较为缺乏,现有的民族教育政策研究主体主要是中央民族事业管理部门、民族地区教育行政部门以及各民族高校的民族教育政策研究院等[20],研究主体并不能与研究客体相对应。主要原因在于,我国缺乏本土的教育政策评估理论体系,难以指导本土教育政策评估实践。有学者指出,教育政策评估理论缺乏系统性,通常有如下缘由:忽略了评估理论的研究或者理论研究的时间不长;
缺乏一致的评估核心概念;
忽视了基于实践的理论验证;
过于关注项目理论研究,缺少系统理论的研究;
缺失对于理论研究的政策支持[21]。对于我国而言,教育政策评估是一个相对年轻的研究领域[22],至今发展不足30年,系统的本土教育政策评估理论体系尚未完善。因此,需要树立系统化的发展意识,通过政策支持尽早建立符合我国现实情形、能够应对我国复杂且广泛的教育政策议题的教育政策评估理论体系。
再次,缺乏成熟的教育政策评估研究组织机构和队伍,导致评估缺少系统性。我国规范的教育政策评估研究组织机构和队伍尚未建立,导致评估研究者对政策的背景缺乏专业且全面的了解,难以有责任意识,容易造成评估片面而难以落到实处,这也解释了为何我国教育政策评估发展缓慢以及为何政策会产生预期之外的结果。我国教育政策评估主体的发展主要经历了从党政主导下的单一评估到第三方评估机构兴起再到公众参与评估的一元到多元的变迁[23]。当前,我国教育政策评估主体既有垂直结构中的行政部门、立法部门,又有来自水平结构中的社会组织、公众、大众传媒和舆论[24],其中为了关注评估过程的价值和结果的公平,尤其追求教育政策评估中的公众参与[25],但缺乏相对稳定的机构和队伍,导致研究标准难以界定,评估没有向导,研究方法和模式难以确定,教育政策执行过程中常常因为缺乏充分的协调与合作,而出现教育政策执行碎片化问题[26]。例如,我国的中外合作办学政策力图通过与世界一流资源合作,引进国外高校的优质课程和方法,提升高校课程质量和教学水平。截至2018年,我国本科及以上中外合作办学机构和项目共有1 090个[27],其中一些机构的做法值得关注,如宁波诺丁汉大学、上海纽约大学对于师资建设机制的创新,昆山杜克大学对于学科建设的新探索以及浙江大学海宁国际校区对于高校管理机制优化的成功经验[28]。但是,在中外合作办学政策评估中,由于缺乏成熟的机构和队伍带领,缺少对于教育政策的有效评估标准,无法根据不同情形制定相应的评估机制办法,导致有些学校缺乏长远规划,为了满足评估标准,甚至依赖中介公司的推介,出现“国外无业游民摇身一变为中国高校教师”的现象。因此,只有成熟的教育政策评估研究组织机构和队伍带领下的教育政策评估及其研究,才能拥有更为灵活的评估机制、更加实际的评估方案和办法,帮助教育政策各层各级的评估更为有序而有效。
(二)教育政策评估研究的互动形式缺失
其一,缺少理论与实践的互动,出现“两张皮”现象。“两张皮”指的是我国教育政策评估研究理论与实践相脱离的现象。从研究方法的角度看,我国以理论(概念性)研究方法为主,其余方法使用较少,实证本位与规范本位的研究方法应用比例失调,割裂了教育政策评估的事实研究和价值研究。研究脱离实践,也就脱离了政策的实施环境,研究结论不能落地,自然难以对教育政策产生应有的反馈性影响。相较之下,西方教育政策评估实证本位与规范本位的研究方法使用相对协调,历经四代变迁的西方教育政策评估当前处于以技术和事实为中心的第三代评估与以主体价值为中心的第四代评估的对峙共存之中,正从关注政策效率与效能的第三代实证主义范式逐渐转向关注“效率和效能是为了谁”的基本问题的第四代建构主义范式[29]。理论来自实践而指导实践,布迪厄的“实践理论”就要求理论从实践出发,进而提高到理论概念,然后再回到实践去检验[30]。我国教育政策评估研究理论与实践相脱离的现象较为严重,如20世纪90年代我国刚开始实行高等教育扩招政策,学者们就从高校扩招对于经济发展带来的影响、就业形势以及高校教育质量的发展等方面进行了分析与评价,认为其能为提高整个民族的文化素质带来积极的长远影响,也会对教育质量、教育资源等方面带来负面影响,但在政策实施过程中,理论研究结果对于政策的改革作用却十分有限,归根结底还是政府部门作为教育政策评估主体的缺席所致。
其二,缺少多元视角的互动,研究模式单一。我国教育政策评估模式集中于目标达成模式和利益相关者模式,这二者所体现的以目标和人为中心的思路是经典的教育政策评估研究视角。对这两种模式的集中关注一定程度上归因于我国教育政策评估一直以来所推崇的价值基础,即追求教育目标的达成、教育权力的自由、教育主体平等的参与。但是,不同研究视角有重叠之处,需要结合不同情况调配不同的模式[31],且随着教育外部环境的不断变化,教育政策评估研究需要开阔的视野和开放的思路,才能适应教育领域灵活与自由的氛围。如大学生就业政策,如果单一地通过就业率这项结果评估政策实施情况,则很容易推进盲目上报就业率之风;
要解决就业这个现实问题,既要考虑民生问题,又要结合经济环境,还要融合不同的政治体制特征,同时不能忽视当下特殊的疫情环境的影响;
光是从学科角度进行思考,就有社会学、经济学、心理学、政治学、管理学等不同学科视角。教育政策本身就是一种典型的复杂性系统[15](P14-28),其中教育政策评估既有中央和地方的层级差异,又有着省、市、县、校际之间的不同,还有各政策执行人员的价值观差别造成的理解偏差等。因此,单一的研究模式绝不可能反映出教育问题的繁杂。
其三,忽视了我国的多元文化环境,研究“生态”不适切。教育政策活动根基于塑造生命文化的“生态世界”[32],在中国的大“生态”环境下,每一种文化都有其独立发展性,多种文化的共同发展形成了我国多元的文化格局。不同的文化“生态”既表现为各民族的“生态”差异、城乡的“生态”差异,也体现为不同政策议题的“生态”差异,而我国教育政策评估及其研究缺乏对不同差异的区分。最为典型的是我国的民族教育政策评估,民族教育政策的目的应是保障不同民族的弱势补偿,传承民族优秀传统文化,通过民族教育政策的实施帮助民族地区的教育得到发展,提升教育治理能力[33]。而我国更多地运用民族地区的教育政策评估方法和技术去笼统评估不同的民族,模糊了不同民族之间评估内容的生态边界,降低了教育政策评估的科学性与公平性。又比如,城乡二元结构背景下,教育政策评估在价值取向和目标上长期带有城市倾向,缺乏“生态”适宜的政策议程和博弈机制[34],导致政策制定层面的目标考核单维化,政策评估效果差。再比如,在中外合作办学政策评估指标中,有“四个三分之一”指标①中外合作办学评估指标体系中的“四个三分之一”指标,具体包括引进的外方课程和专业核心课程应当占中外合作办学项目全部课程和核心课程的三分之一以上,外国教育机构教师担负的专业核心课程的门数和教学时数应当占中外合作办学项目全部课程和全部教学时数的三分之一以上。(来源于《教育部关于当前中外合作办学若干问题的意见》(教外综[2006]5号))。这些指标仅湖南省长株潭地区和湘西地区的高校之间相比都会有较大的实施差别,何况中西部地区和东部地区高校之间的实施差异,因此也出现了办学过程中较为普遍的评估指标未达标情况,使办学活动难以持续。
(三)教育政策评估内容的自由思维匮乏
一方面,缺乏非功利的自由精神,评估程序不完整。非功利的自由精神,是创造的与享受的[35]。我国教育政策评估研究偏向于结果、绩效、效果的研究,具有功利性倾向。完整的教育政策评估应包含教育政策实施前的预测评估、教育政策实施过程中的监控评估以及教育政策实施后的结果评估。我国当前绝大部分研究是针对教育政策实施后的评估,面向政策实施前及实施中的研究很少,关注度不平衡造成评估结果不准确。预测评估缺乏导致一系列由于方案缺乏科学性及现实性而造成的“执行难”问题,直接影响教育政策目标转化成为教育政策现实的效率,也使以此得到的政策实施后的评估结果的科学性难以把控。这种研究偏向的主要成因在于我国现存的“功利性”的“差序格局”。西方国家对于“公”与“私”有严格的区分界限,每个“私”代表着一个团体,不同团体之间也有等级或者层级的分别,而这些也会事先规定好[36]。中国的“公”与“私”的关系界线则不那么清晰,好似“把一块石头丢在水面上所发生的一圈圈推出去的波纹,每个人都是他社会影响所推出去的圈子的中心”[37]。这种传统结构中的圈子具有伸缩能力,小到自己或者自己的小家庭,大到国家、世界。圈子内的是“私”,圈子外的是“公”,圈子内的与“我”息息相关,圈子外的与“我”无关。一个完整的政策周期会经历政策制定到政策执行、政策评估再到政策终结或修改的循环,虽说教育政策实施前对教育政策的文本、内容及方案的评估以及教育政策实施中对政策执行过程的评估都涉及相应的“私”方,但是相较而言,教育政策实施后对相关利益者们所能带来的效果和影响却是涉及范围最广的。对于普通民众而言,政策的制定和执行是政府及行政部门的工作,政策造成的结果及影响却是与自己密切相关的。例如高校扩招政策,其主要目标之一是拉动经济增长、缓解就业压力,而对于其带来的新一轮就业压力的预测评估较少,主要关注点在于政策实施后对于社会、各利益团体以及个人等带来的影响[19](P159)。从这个层面来看,我国教育政策评估更为关注结果、绩效、效果等的研究似乎有迹可循,呈现较大的功利性特征。
另一方面,缺乏开放的交流,评估指标失衡。我国教育政策评估内容缺乏开放性,偏重于应然指标,轻视实然指标。我国学者认为教育政策的评估实际就是评估其价值,应从价值存在(质、量、尺度)、价值规范(应该)和价值必然性(正当)三个层次构筑教育政策的评估标准[38],以重视价值基础。西方则既注重应然指标也关注实然指标。如经统计,西方教育政策评估文献中出现的关键词大致分为两类:一类主要关注绩效、成绩、表现等,一类主要关注人的特点、价值准则及需求等[39]。我国的重应然轻实然的评估偏向应归因于我国传统的思维方式。中国哲学和西方哲学的根本区别在于,中国哲学从直觉概念出发,西方哲学则从假设概念出发[40]。西方有着发达的海洋文明背景,随着贸易的发展,商人们逐渐形成了数学的思维和头脑,擅长数学、科学等逻辑思维较强的学科,更喜欢用有把握的、明确的方式去认识和对待这个世界。中国的“直觉概念”则是审美的,感性的。中华民族以农业活动为生,土地是基础,从而我国历史上的政治、经济思想和文化总是围绕着土地的利用和分配。中国哲学的这种农耕背景,需要人们拥抱自然,从自然的直观中去认识世界。而“农”的眼界限制了中国哲学的思维与方法论。这种“直觉”的思维让我们习惯于思考理想的高度、目标的价值等,教育政策评估指标也依然延续这种“直觉概念”,大多是较为理想化、依据政策实施前的政策文本构建的评估指标。再看中外合作办学政策评估的“四个三分之一”指标,就因为是未考虑实际情形制定的应然标准,造成政策目标难以达到[41],令人们不禁要质疑政策的作用和评估的意义。现实中,我国教育政策评估指标重应然而轻实然,评估研究却偏向于结果、绩效、效果等,“链接”缺乏完整性,对政策实施前的目标评估与政策实施中的监控评估重视不足,呈现出一种矛盾状态。
那格尔认为,“好的政策研究”满足以下标准:能在推动改革的同时保持政策的可持续发展;
能够理论与实际相联系;
能从多学科视角并以政治科学为基础进行研究;
兼顾价值导向与量化思维;
研究具有效用;
能够体现出多元意识形态[9](P19-23)。本文认为,在这些标准的前提下,适合“本土”特征的才是“好的政策研究”。
(一)共创“三足鼎立”式的教育政策评估研究主体
所谓“三足鼎立”,也即在政府的顶层领导下,各教育行政部门、各高等院校政策评估研究中心以及教育政策评估研究学术共同体联合进行教育政策评估研究,构建全国共享的教育政策评估信息系统,促进各研究主体之间的互动。
其一,设计适应我国自上而下教育体制的评估模型。相较于以独立第三方机构为主体的外部评估,政府领导下的内部评估更适合我国政治体制特征。我国教育政策评估研究由中央政府领导,教育行政部门密切参与。2017年,国务院办公厅印发《关于深化教育体制机制改革的意见》,提出要坚持顶层设计与基层探索相结合,尊重基层首创精神[42]。政府既是评估研究的领导者,也是评估的主体之一,我们应遵从中共中央、国务院对全国教育工作的领导和管理地位,以自上而下的原则为评估基准,设计适应从中央到地方各级人民政府对各行政区域内的教育政策进行预测、监控以及参与执行的评估模型。
其二,搭建评估研究学术共同体。当前,作为主要教育政策评估研究主体的各高等院校研究中心过于分散,应该搭建由各高等院校研究中心组成的研究学术共同体,构建教育政策评估研究组织机构和队伍,促进我国本土的理论体系化发展。科学的教育政策评估研究学术共同体需要配备充足的专业人才,专门的硬件设备和技术,拥有健康的教育政策评估文化,具有批判性的视角,关注具体政策的特定环境、特有的自然和社会意义,聚焦权力、制度、实践等带给具体政策制定、执行与结果的影响,而减少受到传统实证主义范式与诠释主义范式的单方面影响。评估研究学术共同体作为评估主体之一,相对独立于政府与各高校,可以专心对教育政策评估的结果和过程进行元分析,能够帮助设立评估的目标,形成指导评估的规则,增强对国际经验的辨别能力。
其三,建立全国共享的教育政策评估研究信息系统。教育政策评估研究信息系统既是三大评估研究主体之间的信息沟通与共享的渠道,又是实时记录各教育政策实施现状数据的载体。一方面,教育政策评估研究机构之间、研究者之间需要加强信息互动,将独立的研究串联成信息系统,减少低效工作。另一方面,每一项政策的整个政策周期都会产生大量信息和数据,这种信息海洋增大了评估研究的挑战:比如,如何选择正确的时间、合适的地点并考量全面结果的“时间挑战”、如何利用有限的能力与资源进行准确评估的“资源挑战”、如何应对不同领导者不同风格的“政治挑战”等[43]。因此,在互联网大数据流行趋势下,我们需要做的是:一方面,积极利用云平台构建我国特有的教育政策评估研究数据库,进行完整的、系统的追踪性数据记录,将无限的信息有序化;
另一方面,在教育政策评估研究学术共同体的带领下,实现政策数据信息的共享与交流,从而提升教育政策评估研究的效率与科学性。
(二)共建多元互动的教育政策评估研究体系
其一,重视教育政策评估理论与实践的协同发展。我国教育政策评估理论研究应注重与评估实践的联系,而当前二者之间脱节的主要原因是作为政策制定者的教育行政部门在研究主体中的缺席。政府部门参与教育政策评估研究,能够有效改善“两张皮”现象,减少“为了评估为评估”的无效工作。理论研究脱离实践,就脱离了政策实施过程中会经历的复杂内外部环境,忽视了实践中才能遇到的多重视角,难以确定不同场合之间的理论适应性[44],也就陷入了泛泛而谈的尴尬境地。理论研究与实践互动,不仅在于我国对于理论的研究不能脱离于具体实践,也在于我国对于西方教育政策评估研究理论的学习需要立足我国的政治环境、文化传统,通过有选择地吸收与学习,建立起适合我国国情的教育政策经验研究,挖掘实在的教育政策事实基础,提炼出本土的概念,促进本土教育政策理论的积累和教育政策过程的改进[45]。
其二,融合多样的教育政策评估方法和模式。我们通过多元方法、多种模式以及多样的视角进行教育政策评估研究,将有利于科学评估教育政策全貌。西方教育政策评估研究的不断发展之道就在于不断推进研究范式,不断尝试融合不同范式之间的优势,结合规范研究和实证研究,平衡研究的科学性和现实性[46]。当前我国直面四代评估范式的特点,我们应顺应国际发展的趋势,从较为根本的角度对教育政策评估方式进行改革,“通过科学共同体的内部冲突,选择从事未来科学活动的最适宜道路”[47],将教育政策评估研究发展的视野放置于探索多元弥合型的评估范式,充分发挥实证主义范式与建构主义范式的结合优势,把握不同范式下评估的特点及各要素之间的相互关系,看到变革的整个过程,而不仅仅是线性的原因-结果链,也不是一闪而过的评估画面[48],从而更适应我国的多元生态文化特点。
(三)共探自由开放的教育政策评估内容
一方面,构建“循证”的教育政策评估指标体系。我国的“直觉”思维限制了研究者们对于实然指标的关注,需要重构“循证”的思维模式。对教育政策评估“实然”指标,应遵循价值判断和事实分析的“证据”进行构建。一般而言,事实判断的依据来源于政策实施过程中能够收集到的包括文字、信息、图像等比较明显的证据,即通过统计数据、理论研究、过往经验等进行事实判断的评估指标构建。而价值判断的资料获取方式却相对复杂,价值判断的依据来自于利益相关者,包括评估的受益者、评估的受害者以及评估需要的要求者、评估结果的利用者和评估工作的执行者等[2](P51-67),他们的不同诉求汇聚成对于某项教育政策的价值判断依据。我国教育政策评估指标也应匹配这些事实和价值“证据”构建相应的实然指标体系。
另一方面,探索“链接”完整的教育政策评估程序。“链接”完整的教育政策评估研究不是功利的、静止的,而是非功利的、动态的。弗兰克·费希尔曾提出政策评估的四个层次,从技术验证到情景确认、系统论证再到社会选择[49],这四个层次并未严格区分各个分界线,分析技术视角、阐释政治视角以及批判话语视角在各个层次之间都有重叠应用现象。同样,教育政策评估研究也是一项循环且动态的过程,从政策制定到政策执行,从政策评估到通过评估研究去指导政策改进再进入下一周期,各个环节相互“链接”,缺少任何一环都容易陷入“为了评估而评估”的陷阱。“链接”完整的评估研究程序主要应有两个特点:一是重视政策实施周期内评估的完整性,关注教育政策评估全过程,兼顾政策实施前、实施中以及实施后的评估,保证评估的完整性与科学性;
二是能够进行动态的教育政策评估研究,帮助更全面地认识教育政策生态系统这个公认的复杂系统,灵活地把握教育政策的价值和目标,探寻科学的教育政策评估研究内容。