英国大学研究考评对中国的反思

admin · 发表于 2014-12-27 18:08:24

前言：英国2014年大学的研究评比于2014年12月18日正式出炉。这是对英国大学最全面、最客观的评价，也是英国政府利用有限的科研投入，取得最大研究产出和促进英国高校领先世界最科学、最客观、最有效的办法。本文比较详细的介绍英国大学研究评比的一些情况，比较中国目前对大学建设的做法，希望在对比的过程中，为中国政府今后促进科学研究，提高投入产出率，有所帮助。

英国大学研究评比促进总体研究水平的提高和人才流动

任何国家对科研的投入都是有限的，如何把有限的科研投入去取得最好的研究成果，是考量一个国家管理科研、促进科技发展的重要依据。

英国政府对大学的投入，从30年前就开始减少（指政府投入占大学总收入比重），但是，政府依然希望大学在政府支持力度减小的情况下，继续保持世界领先的地位。

我们知道英国只有6100万人口，是美国的五分之一，经济总量是美国的七分之一。在科学研究方面，英国与美国拚总量是远远不行的，从最近20年的诺贝尔奖获得者的情况上看，英国越来越比不过美国。

然而，如果考虑到英国的相对体量比美国小，英国的相对科技产出，却领先美国。尤其是世界前10位最好的大学，英国一般占3位到4位，美国占6到7位。前一百名的世界大学，美国一般占37位，英国占10到12位。世界科技的最重大突破，英国的创新强度也高于美国。

英国科技领先、大学科研和教育领先的秘诀，除了有牛津和剑桥的长期不可撼动的历史地位以外，伦敦市有好几所大学（帝国理工、伦敦大学学院、伦敦政治经济学院、伦敦大学国王学院），还有伦敦外面的爱丁堡、华威、诺丁汉、曼彻斯特、利兹、谢菲尔德、伯明翰、布里斯多等一批重量级的大学，都有很强大的拼斗精神，不管英国经济出现什么样的挑战，这些大学都体现出非常顽强的科研斗志。

从大学里面来讲，每个大学都有自己科学的激励机制。从全国一盘棋来讲，政府客观、透明、高效率的考评机制，是激活大学数万研究人员积极性、创造性的重要基础。

一个科学完美的考评体系，必须具备如下条件：（1）标准化，（2）透明化，（3）公平化，（4）操作的可行性，（5）体制的可持续性，（6）效果的长效性，（7）经济效率最大化，（8）社会影响最大化，（9）大学、老师和学生的利益受到最大的激励和鼓舞。

英国高教部从1992年开始全国性的科研考评，取的名字叫做Research Assessment Exercise （RAE）。这个考评由高教部组织，把全国的大学分为40个大学科，例如医学、生物学、工程、数学、化学、物理、经济、商学、法学，等等。各个大学根据自己的学科分类，参与若干个学科的评比。大学专业齐全的（如剑桥、牛津、伦敦大学学院、帝国理工、诺丁汉等），参与评比的科目就比较多，大学专业数量少的（如伦敦政治经济学院、伦敦商学院等）参与评比的项目就比较少。

研究的成果以发表的科学论文为主，有的学科书和其它产出也比较重要。每个参加评比的大学老师，在6年之内，只需要提交4篇最好的论文（或著作）。如果一个老师在这段时间出版了超过4篇论文或著作，那么，这个老师就只需要挑4个认为最好的参加评选。

这样的考评方法，显然在于注重质量而不是数量。不过，如果某一位科研人员，在指定的时间段里没有4篇文章（或书），他（她）就不能参加考评，除特殊的情况，例如他（她）的工作时间不够长，或者由于生病或者产假而没有办法在指定的时间段里全职工作。

这种考评规定，给每一个大学老师造成一种无形的压力：如果在这段时间里没有足够好的4篇产出，就要面临出局，对职称的提升、工资的提升，就有很大的影响。

这种考评机制，也给学术成就多、产出质量好的大学老师，提供升职、加薪、跳槽的机会。例如，一位老师如果在大学A得不到提升，而大学B却需要这样的老师，因为他（她）的研究成果比较好，这位老师就很容易通过跳槽的形式从大学A申请到大学B工作。因此，英国的研究评比，不仅促进每位老师的研究进步，也促进各个大学为了吸引研究能力好的老师不断创造更好的条件，从而促进大学之间的激励竞争。

英国的研究型大学追求的是世界水平的卓越，因而，任何一个职位都要面对全球招收，导致高端的研究型大学教师有超过30%的人来自英国以外的国家。有些专业，找不到高水平的本土老师，只好放开对人种和国别的歧视，只要研究能力强，外国人与本国人理论上不存在任何歧视政策，也没有性别、年龄的歧视。

英国大学研究评比的具体做法

从1992年开始，英国大学的研究评比已经进行了5次，分别在1992年，1996年，2001年，2008年和2014年进行。

本来的计划是每4年进行一次，后来因为种种原因，时间拉长到5年（1996-2001）和6年（2008-2014）。

1992年和1996年的两次研究评比，每个参与评比的单位，根据其报送的研究成果进行评比，每个单位被打一个平均分数，如果平均分数接近最高水平，这些单位被定为5级，如果平均分数低一个档次，就被定为4级，后面还有3级，2级和1级。

一般来说，5级的研究水平代表世界领先，4级为世界优秀，3级为国际认可、国内领先，2级为国内先进，1级为国内认可。

到了2001年，原来的5级被5*，5，4，3a，3b，2和1七个等级所代替。增加5*级，主要是为了突出那些特别强的系科单位。把3级分为3a和3b是因为有太多的单位处在中间的水平，只好用两级来拉开这些单位的距离。

1992年，1996年和2001年的评比都存在一个通病，如果一个单位的平均分数达到一定程度，这个单位的所有参比人员，都被定为某个等级，也就是说，某个大学的某个专业，只要有足够的人把平均分数拉高，就可以把一些成果差的人也拉高。相反，某个大学的某个单位，如果有比较多的人分数不高，那些本来成果非常好的人也被拉下去。

为了辨别同一个单位不同研究人员的成果差别，2008年的评比方法做出很大的改动。第一个重大的改动，是把原来的（5*，5，4，3a，3b，2和1）七个等级，改为（4*，3*，2*，1*和unclassified） 5个等级。第二个改动，就是把每个单位提交的所有文章和著作，一个一个的打分、分类，然后，每个单位的所有文章，按照每个等级得到的百分比，给出一组概率分布数列，而不是以前的一个简单等级。

拿我所在的诺丁汉大学当代中国学学院的例子来说。我们学院2007年成立，2008年就参加那一年的研究评比。我当时拼命招了许多新的，成果比较好的老师，最后总算有13人参加评比，在英国20多所有中国学（亚洲学）的大学中，有13人以上可以参加比赛的单位只有6所大学，所以，我们第一次参加就有13人，也算是很不错了。

2008年的评比，论文和著作占总分的比例为70%，研究环境和影响力占30%。我们是新的学院，没有任何博士生，也没用科研经费的记录，所以，最后的评比结果只能靠论文和著作的质量来拚。

那次我们得到的结果是这样的：4*（10%），3*（20%），2*（40*），1*（30%）。也就是说，13人提交的（13*4=52）篇文章和著作中，有5篇是4*水平的，10篇是3*水平的。总的加权平均分数（Grade Point Average, or GPA）为2.10, 在所有参加评比的20多个大学中，排名第6位。

考量一个单位的研究水平，可以有多个指标。最显眼的指标是GPA，每个参比单位都可以用GPA（满分为4分）来排列，越靠近4的单位，其平均研究质量越高。

用GPA来考察一个单位的研究水平有非常明显的优点，因为，谁的分数高，谁就比较好。但是，GPA有一个很明显的缺点，就是它不能代表某个研究单位的总体研究力量。

例如，有两个大学A和B同时参加某一学科的评比，A有100人， GPA是3.1，B参比人数只有10人，GPA是3.2。按GPA比，B好过A。如果A提前知道这个结果，A完全可以把最差的10人剔除，剩下90人参比，使GPA超过B。由此可见，用GPA来评判B好过A是有问题的。为了避免GPA的片面性，可以用研究力量（Research Power）来评判。

Research Power = GPA 乘以参比人数。上面两个大学的研究力量为A=310，B=32。也就是说，B的GPA比A高，其实际的研究力量却只有A的一小部分而已。

就整个大学而言，其研究力量就等于该大学的总体GPA乘以其所有的参比人员。2014年，伦敦大学学院（UCL）超过剑桥大学，一方面是两个大学的GPA很接近，尽管剑桥的GPA比UCL略高，但是，剑桥参比人数却比UCL少，所以，剑桥的研究总体实力首次被UCL超过，屈居第三名。

2008年以前的所有评比，只考虑研究环境（包括研究条件、经费、培养博士生和博士后的情况，教授的科研支持力度等），但是没有考虑研究成果对社会的影响力。

2014年在2008年的基础上引入研究成果对社会的影响。每7-8位参比人员，就要求提供一个影响社会和经济的案例。

例如，我所在的诺丁汉大学当代中国学学院，2014年有22人参加“Areas Studies-Contemporary Chinese Studies”的比赛，比2008年多9人。我们必须提供3个影响的案例，一个由我和宋丽娜教授牵头的案例：中国经济影响案例，一个由武斌博士为主的移民研究案例，还有一个是由王正绪、赖洪毅和曾瑞生三位政治学学者组成的政治研究影响案例。

2014年的文章和著作占60%，社会影响案例占25%，研究环境占15%。我们学院的最终结果是：4*（16%），3*（45%），2*（37%），1*（2%），GPA是2.75，Research Power是60.5。

这个参比结果比2008年不仅在数量上，而且在质量上都有重大的提升。参比人数提高70%，4*（世界领先）和3*（国际杰出）的成果提高一倍多，占比为61%。同时，诺丁汉大学当代中国学学院是英国唯一一所用当代中国学的名义参与本次评比的大学，其它大学都是“大杂烩”的地区研究，包括所有的国家。所以，诺丁汉已经成为英国唯一一所高质量研究中国问题的大学。

2014年的研究评比名称也从原来的RAE改变为REF（Research Excellent Framework）与2008年以前的最大不同，就是强调影响，其目的是为了使研究更好的服务于社会经济的发展需要，而不是为了研究而研究。

英国2014年大学研究评比情况总结

参加本次评比的大学150多所，参比的研究人员52000多人，分为4个大领域，36个大学科。参赛人数最多的是UCL，超过2500人，超过1000人的大学都是英国著名的综合性大学。用研究总体实力排名，牛津第一、UCL第二、剑桥第三、爱丁堡第四、曼彻斯特第五、帝国理工第六、国王学院第七、诺丁汉第八、布里斯多第九、利兹第十。

根据预算，英国每年将给所有的大学根据研究评比的结果进行拨款，总额为20亿英镑。跟据研究总体能力排名的大学越好，今后得到的拨款就越多。例如，牛津大学的拨款将占所有大学拨款的6.24%，UCL占6.07%。排名前10的“巨无霸”占所有拨款的比例为40%。这说明英国的研究非常集中在最靠前的少数大学。

研究总体实力在某种程度上掩盖了一些专业性非常强的大学的突出研究表现。这些大学的人数少，参赛的单位也少，但是，它们在各自的领域研究非常突出。例如，伦敦政治经济学院，参比人数只有500多人，但是，在各自的参比领域，都处于前几名，经济学排名第二，仅次于UCL。伦敦商学院只参加商学一项比赛，排名第三。这样的专业，甚至单科的大学或机构，还有不少，包括艺术类院校。

排名的另一个指标，可以参考4*级产出的比例，也可以参考4*和3*级产出总比例。因为，每一个4*单位，可以等于2.5个3*单位的拨款量。2*和1*的产出，基本没有拨款，或者少的可怜。

英国的这种研究评比，使研究型大学大大得到好处，以教学为主的大学，得到的科研经费就少的可怜。教学型大学，能够参比的人数非常少，GPA也比较低，所以总体研究力量微不足道。这是一种集中力量办好少数研究型大学的做法，其竞争程度是白热化的。一些小的大学，或者总体研究能力比较低的大学，也出现一些研究领域处于比较领先的地位。就算总体能力不行，为了在大学系统里取得认可，多数大学都会争取参加评比，否则一点研究地位都没有，大学也很难生存。

2014年英国研究体量最大的10所大学

下面的表是2014年英国大学研究评比10所综合研究能力最强的大学，其排名根据Research Power（研究力量）。研究能力是研究质量（GPA）乘以参比的研究人员数。

第一列是2014年的排名次序，第二列是2008年的排名次序。第三列是大学的名称。第四列是该大学参与评比的单位数，例如UCL参加所有36个学科的评比，牛津只参加31个学科的评比。第五列是参加评比的研究人员数量，以千为单位。参加评比人数最多的是UCL，共有2570名研究人员，其次是牛津，有2410人参加。第六列是用100分制打分的结果，牛津是满分，UCL得97.3分。

第七列是质量指标，牛津和帝国理工的质量最高，剑桥排第三，UCL排第四。第八列是该大学的研究能力占全国研究总体能力的百分比。例如，剑桥占全国整体能力的6.24%。最后两列是研究成果4*和3*的比例，尤其是4*比例，往往是最好的质量指标。因为一项研究得了4*，它代表的世界领先水平。

与上一次研究评比相比，国王学院的进步最大，不仅参加人数提高20%以上，GPA也提高了，所以，按研究力量排队，国王学院从上一次的11位提高到第7位。UCL超过剑桥，主要是体量的提升，尤其是UCL兼并了伦敦大学教育学院（Institute of Education），伦敦大学教育学院是英国教育领域的排头兵，230多位研究人员的成绩非常优秀，给UCL的总体实力增添了光彩。

本次研究结果，打破了牛津和剑桥的高度垄断地位，伦敦的帝国理工、UCL、国王学院、伦敦政治经济学院，成了可以与牛津和剑桥叫板的大学，也再次强化了伦敦、牛津和剑桥的金三角地位，成了英国科研力量最集中的动力中心。

英国研究评比对中国大学科研管理的启示

应该说，英国的研究评比不是没有缺陷的。例如，每个研究人员只有4篇文章（书）参加评比，那些发表许多文章的研究人员，在评比的时候就吃亏了。这样，使一些光靠4篇文章取胜的人在评比的时候得到高分。另外，1000多位评委，负责52000人的研究成果的鉴定，很难做到百分之百的准确。

但是，任何一种评估，都不可避免存在一些缺陷。尤其是那些研究能力比较弱，但是对社会影响大的大学和个人，在评比的时候被边缘化。

然而，英国的大学研究评比，可以说是目前最好的评比体系。每个人都得到相对客观、全面的考评。所有大学、专业，都有得到客观、全面、系统的评价机会。

几年做一次评价，不仅对现有科研人员是一种挑战、鼓励，也是对未来的科研人员提供一个明确的发展方向。

英国的这种评比，是对过去数年的考察和监督，也是为下一个数年提供前进的动力。英国的研究经费有限，但是，通过这种评比，却可以让有限的资金，取得最大的研究成果。

每个老师都不敢偷懒，那些功成名就的老师、教授也不敢怠慢。怠慢的人，在评比的时候就露出缺点了。所以，英国教授的压力、动力是一辈子的。很少有人在取得教授资格以后就不再努力了。

另外，英国研究评比，是把科研的钱投到已经取得成果的人和单位身上的，也是为下一轮的评比奠定基础，从而激发今后几年的研究努力。

中国大学到目前为止，还没有进行全面的科研考评，没有系统化、全面化和透明化的考评。中国大学也缺乏一种人才的全面流动机制。

中国政府通过985，211，把主要的钱砸在这些被政府圈定的大学。这样，对这些大学的发展当然好，但是，与英国大学靠竞争得到投资的做法，却有很大的差别。

首先，英国最终也是由少数最好的大学占据多数拨款，但是，它们是在通过研究考评以后得到的经费，而不是由政府通过行政手段拨出去的。同样是得到经费，英国大学显然需要很大的努力才能得到，而中国的大学，只要被定为985、211，就可以坐享其成，其研究成果与所取得的经费没有直接挂钩。

其次，非985、211的中国大学，研究实力再好，再努力也没有用，总是得不到特殊的支持，这样对那些有进取动力的大学和专业很不公平。最近，教育部已经对985大学建设做了一些改变，希望通过“2011”建设，重点扶持一些大学的重点学科和研究小组，不过，新的方法，还是在事前给钱，而不是事后拨款，最终也很难把拨款与最后成果挂钩，对那些有成果而得不拨款的单位也不公平，从而不可能让政府的拨款营造一个可持续、全面、公平、透明的研究创新生态环境。

再次，由于考评大学老师没有全国的统一标准，人才在大学之间的流动受阻。就算有人才流动，一般都是通过一些特殊的联系，或者某种局部的需要来完成，而不是为了提高大学的整体研究力量，去系统性地进行研究创新能力的建设。

当然，中国有中国的国情。许多大学也是为了提高其信誉度在努力去招收一些有能力的研究人员。不过，没有透明、严格的全国性研究评比，就很难让所有大学、所有专业、所有的老师都有一种持之以恒的压力、动力和顽强的拼斗精神。

中国能否实行像英国这样的研究评比办法？估计目前的生态比较困难，不过，随着科技发展，大学的发展，我相信，逐步借鉴英国的做法是有必要的，因为，如果真的能够这样，中国大学才具备冲刺世界前沿的体制保障。中国目前研究创新不差钱，差的就是一种公平的研究评价体系，一种能够激发上百万大学老师和科研人员最大发展潜能的体制机制。

admin · 发表于 2014-12-27 18:08:34

http://sujieyao.blog.ifeng.com/article/34702933.html

帐号		自动登录	找回密码
密码			实名注册