欧美高校科研评价的发展及其对我国科研评价改革的启示

2024-04-24 07:45陈韵安夏泰凤
广西教育·C版 2024年1期
关键词:国际比较

陈韵安 夏泰凤

摘 要:我国高校长期以来沿用的以论文收录数、引用率等量化指标为导向的科研评价体系已无法满足将智力资源转化为生产力的新时代发展要求,以质量、社会贡献为导向的科研评价体系已成为高校科研评价改革的必然趋势。在国家政府的宏观引导下,美国、英国、澳大利亚等发达国家的科研评价体系导向均回归到了对科研最原始的价值追求上,评价内容、评价指标日趋精细化。比较美国、英国、澳大利亚等发达国家的科研评价体系,建议建立以质量、社会贡献为导向的科研评价体系,打造多元评价主体参与的长周期评价机制,并结合学科特点采用量质结合的分类评价手段。

关键词:科研评价;国际比较;多元评价主体;长周期评价机制;分类评价

中图分类号:G64 文献标识码:A 文章编号:0450-9889(2024)03-0027-05

在知识经济时代背景下,高校科研的应用价值和社会属性变得至关重要。近年来众多国家都对高校科研评估体系进行了大刀阔斧的改革,力求促进本国科研实力和创新能力的提升。在国家政府的宏观引导下,美国、英国、澳大利亚等发达国家的科研评价体系导向均回归到了对科研最原始的价值追求上,评价内容、评价指标日趋精细化。我国教育部与科技部共同印发的《关于规范高等学校SCI论文相关指标使用树立正确评价导向的若干意见》(教科技〔2020〕2号)也强调了建立以创新质量、社会贡献为导向的科研评价体系的必要性。然而我国高校科研评价的历史也仅短短40余載,经验积累较少。这些发达国家科研评价体系演变的共同规律或许会对我国科研评价体系改革具有一定的参考价值,比如构建以“质量”和“贡献”为价值引领的评价体系,打造多元评价主体参与的长周期评价机制,结合学科特点采取量质结合的分类评价手段。故而本文研究将通过对美国、英国、澳大利亚科研评价体系发展历程的纵向梳理及横向比较,揭示科研评价的演变逻辑和发展趋势,为我国新时代教育背景下科研评价体系的构建提供镜鉴。

一、科研体系的国际比较

(一)美国

美国国会咨询服务部于19世纪末20世纪初对科技活动进行的评估可以看作是美国科研评价的雏形。二战后美国开始寻求科技发展的创新与突破,将科研体系与工业发展和市场需求紧密绑定,其科研活动也由此带上了强烈的实用色彩。1993年美国国会通过的《政府绩效与结果法案》要求绩效考核以一种可量化的方式进行测量,对高校教师科研工作的评价开始侧重于发表论文的数量和刊物等级、论文引证、科研项目经费资助情况等量化指标,直至美国卡耐基教学促进基金会主席博耶在《学术反思:教授的工作重点领域》中明确指出“应以全面的学术观来看待教师的科研工作”之后,“创造性”“学术贡献”才被各高校陆续纳入科研评价的考量维度。近年来,随着美国各界对科学研究成效的关注度日益高涨,美国联邦政府提出了发展科技政策方法学的倡议,并在此基础上创建了“美国再投资中的科学与技术——测度研究在创新、竞争力以及科学上的影响”项目(Science and Technology in Americas Reinvestment—Measuring the Effect of Research on Innovation,Competitiveness and Science,简称STAR METRICS项目),用以测度美国联邦政府科研投资的社会效益。

随着科研评价导向“由量到质”的转变,美国高校的科研评价指标也已经扩大到更广泛的领域,对教师科研绩效的评价并不完全依赖于专著数量、经费数额、论文引用率等量化指标,而更多地关注教师的创新能力、长期贡献,以及包括学术影响和成果转化所带来的经济效益在内的研究成果影响力。比如,加州大学伯克利分校将教师对专业的贡献或教育的新观点作为评价的重要内容,注重观测教师科研工作的原创性思想和效果[1]。

由于政治体制的特殊性,美国并没有统一的科研评价制度,但为了保障科研评价工作的可信度和客观性,美国高校始终贯彻双向匿名评价制度,甚至会邀请其他高校以及欧洲、亚洲的领域内权威专家担任评价专家组成员以保证评价结果的公平性[2]。在科研评价标准的设置方面,不同高校的侧重点也不尽相同,如人文科学类高校在设置评价标准时会更注重跨学科研究,对研究过程当中产出的成果也给予相当的关注。在评价方法方面,美国高校主要采用的是同行评议法和定量指标法相结合的方式对教师的科研工作作出综合性评价。随着高校教师科研评价维度的不断更迭,一些衡量研究成果影响力的评价方法也被开发出来。如经济回报率分析法通常被用以测量科技成果、专利等产生的外部效益,案例分析法、社会评价法常被用以测度科研成果对政策、实践的影响。

(二)英国

英国政府于1919年成立了大学拨款委员会,为确定资助经费的拨付对象,对科研绩效指标的设置进行了长期的探索。20世纪90年代,经济形势的恶化导致政府不得不缩减为科研预留的资金。当时如何保障高校的科研质量并提升高校拨款的效率与合理性成了亟待解决的问题,科研评估体系改革迫在眉睫,英国研究评估考核(Research Assessment Exercise,简称RAE)在此背景下应运而生。

RAE评价体系以同行评议为主,以学科为基础将被评对象分为67个待评单元,由专家学者根据参评对象提供的材料进行评价。评价指标主要包括科研人员信息、主要研究成果、科研机构的政策情况、科研环境等。RAE模式有效提升了英国科研质量与实力,但在实践过程中也出现了诸如评估结果虚高、片面追求评估指标、评估成本过高等问题。为了缩减成本,2008年英国高等教育基金委员会决定采用研究卓越框架(Research Excellence Framework,简称REF)。REF评价体系将评价单元缩减至36个,聘请领域内专家和少量的外部评审员从成果、影响力、环境三个维度对每份参评成果进行评分(见表1)[3]。其中,成果被赋予60%的权重,其评价标准包括“原创性”“重要性”和“严谨性”。影响力衡量的是研究成果的“影响广度”和“社会意义”,参评人员须提交影响力案例报告以证明其研究成果对学术界以外的经济、社会、文化、公共政策等各领域产生的影响,评估结果被赋予25%的权重。环境则以“活力”和“可持续性”为衡量标准,专家组根据参评人员提供的环境报告进行评分,评分赋予15%的权重[4]。

从RAE到REF的变迁呈现出英国科研评估的焦点由内在质量向外部效益的递进。REF模式评估时间一般为6年,要求每位被评对象最多提供4项研究成果参评,较长的时间跨度和参评成果数量的限定很大程度上引导科研人员将更多的时间和精力投入到成果质量的打磨上,追求更高的社会回报。

在指标的选取上,RAE评价模式以“提高科研质量”为宗旨,采用的主要指标包括成果的原创性、学术影响力、研究团队的规模和质量等。而REF模式更强调科研活动对经济、社会发展的贡献,评价指标的设置旨在考查成果是否原创,成果对社会发展的影响程度和重要性,以及成果对广泛学科和研究基础的贡献程度。

(三)澳大利亚

澳大利亚对科研评估体系的探索可以追溯到20世纪70年代,其科研评估体系在国际形势的变化和政府的不断调整下日趋成熟,呈现出明显的阶段性特征(见表2)[6]。

1988年澳大利亚联邦政府就业、教育与培训部(Department of Education,Science and Training,简称DEST)引入“国家教育体系”,正式拉开了高校之间通过各自科研表现来竞争科研经费的角逐序幕,基于科研量(Research Quantum,简称RQ)的科研评价方式也逐渐形成[7]。由于RQ并未对保证财政科研拨款的合理性发挥出太大效力,1995年澳大利亚政府便采用了综合指数(Composite Index,簡称CI)评价指标体系来对高校科研工作进行评价。CI从“科研投入”和“科研产出”两方面衡量参评高校在所有高校研究活动中所占的份额,其中,科研投入的考量因素包括高校通过各种渠道获得的科研资金,科研产出的考量因素包括学术出版物、完成高等学位的人数等。尽管CI极大激发了高校人员的科研积极性,但澳大利亚同期的引文影响力却日趋下滑,引用影响力较低的期刊也越来越多。

为了打造以质量为导向的科研评价制度,DEST开始进行科研质量框架(Research Quality Framework,简称RQF)设计。RQF体系包含13个评价单元,将科研成果的学术影响力、社会影响力、经济效益等作为考量因素,旨在鼓励科研人员投身到高质量研究中去,以优质的科研成果推动社会发展。但RQF未及实施,便被澳大利亚卓越研究评价(Excellence in Research for Australia,简称ERA)取而代之。ERA将评价单元缩减至8个,采用世界标准对科研成果的各项指标进行测度,对所有学科的科研质量进行综合评价。2011年澳大利亚联邦政府在审查公共财政资助的科研项目时,再次将目光聚焦到对科研影响力的评估上,于是一套独立于ERA评估的影响力评价机制——社会互动与影响力评价(Engagement and Impact,简称EI)应运而出。自2018年起与ERA形成并行的配套评估机制,评估科研成果对社会的贡献,引导高校加强与行业等科研服务对象之间的合作[8]。

在指标的选取上,RQ和CI关注的是高校获得的各类资金以及科研人员的学术出版物数量,此类定量评价指标的采用在当时催生了大量科研出版物的出版。RQF采用的则是科研质量和科研影响力两大类指标,每类指标均以“该研究在世界中的地位”为标准划分为五个评价等级,用以探讨世界的科研水平和衡量本国科研成果的内在学术价值及其产生的多方面社会效益。改革到ERA模式后,世界标准成了等级评定的依据,而评价指标则分为研究质量、研究活动、成果应用三类。其中,研究质量从出版物发表、引文分析、同行评议等方面进行考量,研究活动衡量研究收入、研究项目、成果产出的情况,成果应用则测度成果的商业化收入、专利、注册设计等为社会带来的实际效益。值得一提的是EI体系中“参与”和“影响”两大评价因素,“参与”的评估指标多与外部资助的研究经费相关,而“影响”方面的测量则需要被评对象对其科研影响进行具体阐述(见表3)[9]。

二、国际科研评价体系的演变特点

尽管美、英、澳的科研评价体系在评价内容、评价方法上各具特色,但均遵循相同的演进逻辑和发展趋势。主要表现为以下几点。

(一)以国家政策为改革行动指南

美、英、澳科研体系的历代改革均有明确的改革目的,并由国家政策积极引导推动,如英、澳两国的科研评价体系改革是为了给政府拨款提供更合理的决策依据,美国的科研评价体系改革是为了给高校和科研工作者提供发展建议。这些国家的科研评价体系改革无一不是为了适应当时的社会背景和满足时代需求,努力促成国家整体科研水平的提升,使科研始终为国家的整体发展服务。

(二)以实际效益为评估价值遵循

由于美、英、澳三国高校科研资金来源的多样化,这些发达国家的科研评价结果也受到诸如政府、学术同行以及各类社会受众等科研服务对象的关注和监督。随着科研服务对象价值观念的转变,社会对科研成果的要求也逐渐从重“量”走向重“质”。美、英、澳近代科研评价体系的改革都旨在追求研究成果的创新性与应用率的最大化,要求科研人员不仅能够创造出具有学术价值的成果,而且要实现成果的社会应用价值。美国提出的STAR METRICS项目,英国REF模式“影响力”指标的设置,澳大利亚测量成果带来的实际效益,都体现出对“质”的强调,并在此基础上追求“效益”的实现。这些效益不仅包括如成果商业化后给企业团体和个人带来的微观层面的经济效益,而且包括如运用成果改善生态环境、提升公益福利等国家社会层面的效益。

(三)以评价效力为体系构建旨意

美、英、澳三国的科研评价内容从早期的单一方向转向了如今的多维方向,评价指标的设置日益精细。比如,美国的科研评价在对发表论文数量和刊物等级等量化指标进行衡量的基础上,还将“贡献程度”“创造性”纳入评价指标;澳大利亚在对高校的科研投入产出比进行测量的同时,也愈加强调对科研成果赋能社会发展的评价。此外,这些发达国家采用的评价方法也随着评价导向的转变渐趋多元。比如,美、英的评价方法从早期的同行评议逐渐转向与引文计量、成果计数等计量方法相结合的评价手段转变;澳大利亚则在计量指标的基础上结合专家评审的评价方法,以确保评价结果的科学性、合理性。

三、对我国科研评价改革的启示

近年来,《关于深化高校教师考核评价制度改革的指导意见》《关于规范高等学校SCI论文相关指标使用树立正确评价导向的若干意见》等文件的陆续出台体现出国家对高校科研评价工作的重视,也对饱受诟病的“五唯”学术风向予以一定程度的拨正,但要建立起符合新时代教育理念、助推国家创新驱动发展战略深入落实的科研评价体系,我国应在立足本国国情的基础上对国外经验加以借鉴。基于上述分析,美、英、澳等发达国家的科研评价制度值得借鉴的经验有以下几个方面。

(一)构建以社会应用价值为导向的评价体系

首先,高校应将“质量”作为科研评价的核心目标,将科研评价界定为一项对价值进行研判的活动,而非纯粹的数量统计活动[10]。其次,高校应强调科研产生的有利作用,引导科研人员投入到对民生公益、经济增长、社会发展有切实提升的科研活动中去。如英国REF模式特设的“科研影响力”评价模块,美国STAR METRICS项目对“科学研究影响力”的重点观测,均成功推动了科研力量流向各行各业,实现了国家科研实力的跃升,形成了科研赋能产业、产业反哺科研的有效闭环。

(二)打造多评价主体参与的长周期评价机制

我国科研评价“重量轻质”的部分成因是我国科研评价绩效管理多由高校科研行政管理部门主导,因此要破除以“满足绩效考核指标”为主的行政逻辑对科研评价的约束,建立包括行政管理部门、第三方评价机构、科研成果受益群体等科研利益相关者在内的多元主体长周期评价机制。一方面,适当延长科研评价周期以减少急功近利的科研“投机”行为,给予科研工作者稳定的环境和充裕的时间打造出具有重大社会意义的科研成果,也给予评审专家足够的时间观测科研成果的社会应用价值。另一方面,不同利益相关者从自身的角度出发,会对科研评价作出不同形式的利益表达。如高校行政管理部门行使其行政权力以确保评价实施落地,学会等第三方学术评价机构行使其学术权力以测度科研成果的学术质量,企业、社会受众等科学研究服务对象充分表达其对科研成果的体验和满意程度,以观测科研成果产生的外部效益。不同评价主体在评价过程中互为参补,才能保证评价结果的全面性、客观性和公信力。

(三)探索学科特色量质结合的分类评价手段

根据国务院在《深化新时代教育评价改革总体方案》中“根据不同学科、不同岗位特点,坚持分类评价”的明确指示。一方面,高校应充分考虑到不同学科研究成果的差异性,以学科类别为基础,制定与不同学科特点相契合的评价标准,杜绝以往单纯以论文发表数量、课题立项数量、项目资助金额等量化标准“一刀切”的方式进行评价。另一方面,高校还应根据学科特质选取与之相匹配的评价方法进行多维度评价。如北京电影学院在进行教师科研评价时把出版发行或展映的艺术作品、展映级别、行业影响力选为评价指标,在评价过程中采用同行评议和“代表作制”,在整合同行专家评价意见的基础上辅以作品数量等量化数据作为参考。此种通过多种评价方法针对多个评价指标相互补充印证形成的综合性评价意见,更能对教师的科研工作进行精准研判[11]。

现阶段我国高校科研评价仍陷于“五唯”“一刀切”量化评价导致的科研产出数量繁荣而质量下滑等现实的困境当中,要想冲破藩篱,则需要借鉴国际成熟经验,需要在实践中探索新时代教育背景下高校科研评价体系改革的可行之策,加速构建导向正确、机制合理、手段规范的科研评价体系,为我国学术的健康发展奠定基础。

参考文献

[1]王学松.试析美国高校教师科研绩效评价机制[J].合作经济与科技,2013(23):40-41.

[2]张尔秘,史万兵.美国高校人文科学教师科研绩效评价体系特征与借鉴[J].沈阳师范大学学报(社会科学版),2020,44(1):98-104.

[3]李馨儿.英澳高校人文社科科研评价体系的变革与启示[D].南京:南京农业大学,2022.

[4]蒋玉梅.全球科研评价体系的演进与发展:以美国、英国、澳大利亚、荷兰四国为例[J].国家教育行政学院学报,2013(9):81-86.

[5]Research Excellence Framework 2021.Guidance on REF 2021 results [EB/OL]. (2022-05-12). https://ref.ac.uk/guidance-on-results/guidance-on-ref-2021-results/#2021.

[6]易凡,余小波.澳大利亚学科评估:发展动向与启示[EB/OL].中国高校人文社会科学信息网.https://www.sinoss.net/upload/resources/file/2023/03/14/31402.pdf.

[7]李夏.从RQF到ERA:澳大利亚高校科研评价制度改革研究[D].重庆:西南大学,2019.

[8]张强.移植与创新:澳、英大学科研影响力评价机制的比较研究[J].上海教育评估研究,2020(6):49-54.

[9]Australian Government:Australian Research Council. EI 2018 Framework [EB/OL]. https://www.arc.gov. au/sites/default/files/2022-07/era_ei_2018_framework_0.pdf.

[10]劉宝存,商润泽.新时代高校科研评价的现实困境、逻辑遵循与实现路径[J].北京教育(高教),2022(4):13-17.

[11]徐良生.高校人文社科研究评价体系的自主创新探索[J].高校教育管理,2015(2):48-53.

注:本文系广西教育科学“十四五”规划2022年度专项课题“广西高校教师科研评价体系构建研究”(2022ZJY464)的研究成果。

(责编 卢建龙)

猜你喜欢
国际比较
基于国际视角的《政府会计准则——文物文化资产》探微
中美高等理科教育课程设置的比较研究
购物免税与退税政策的国际经验启示
信用证欺诈及例外原则的比较研究
家居空间设计项目化教学模式改革的国际比较研究
金融资产结构的国际比较及发展启示
借鉴国际经验完善我国大额存单制度的对策建议
公司治理模式的国际比较及启示
环保税的国际比较研究
关于建立云南省巨灾保险制度的建议