科研评价指标纵横谈

作者：武夷山 《光明日报》（ 2015年01月16日 10版）

CFP

在评价考核时，为了减少人情干预，客观指标成了首选。但在实际使用的过程中，这些指标容易被异化成“唯一”或“决定性”指标。其实，论文数量、被引频次、同行评议……这些评价指标和方法绝不是“有你没我”的不可兼容，关键是评价什么对象，各种方式该占多少权重。说句到家话，指标只是工具，用得好不好，关键在于使用的人。

几种评价体系选取的主要指标

自然指数

自然出版集团推出

采用“加权分值计数法”，由科学家选出68种自然科学类期刊。据估计，这68种自然科学类期刊的引用量大约占总引用量的30%。每篇论文的作者数为N，每一位作者对该论文的贡献记作1/N分，同时考虑不同学科间的权衡。

世界大学学术排名

上海交通大学推出

选择获诺贝尔奖和菲尔兹奖的校友的折合数、获诺贝尔奖和菲尔兹奖的教师的折合数、各学科领域被引用率最高的教师数、在自然和科学杂志上发表的论文折合数、被科学引文索引和社会科学引文索引收录的论文数等指标。

中国最佳医院综合排行榜

复旦大学医院管理研究所推出

以同行评议的方式，邀请一定数量专家，综合考虑学科建设、临床技术与医疗质量、科研水平等因素，为本专业领域内医院排名。根据医院专科的平均声誉分值，得出该医院所有专科的总分值，在此基础之上综合科研学术水平总得分，得出最终排名。

A.阿卜杜拉国王大学的挂名“把戏”

沙特阿拉伯的阿卜杜拉国王大学，近几年的国际排名像坐火箭一样上升。在汤森路透公司2014年6月公布的高被引科学家名单上，美国的数量最多（1702人），英国其次（304人），德国有163人，位居第四的中国有134位科学家上榜，而将阿卜杜拉国王大学作为论文署名第二机构的高被引科学家居然也高达130位！2014年10月《美国新闻与世界报道》杂志公布的大学排行榜上，阿卜杜拉国王大学在数学领域跃升为世界第七位，而第一名是美国加利福尼亚大学伯克利分校。

这让很多科学家非常惊讶，要知道该校两年前才建立数学博士培养计划，怎么可能这么快就跃居国际前列？加利福尼亚大学伯克利分校的一位数学教授心生疑窦，开展了一番调查，这才揭穿了阿卜杜拉国王大学的挂名“把戏”——这所大学近些年拼命招募“兼职教授”，尤其以高被引科学家为重点招募对象。他们对兼职教授开出的条件是：每年7.2万美元的收入；为访问该校所做的国际旅行可乘公务舱，学校负责报销；在沙特期间住五星级宾馆。兼职教授要做的事主要是：与沙特本地学者合作，帮助他们提高学术水平；“辅导”本地学者起草项目申请书；尤其是，发表文章时得挂上阿卜杜拉国王大学的名字，将其作为兼职教授的第二机构。当然，该校也希望兼职教授完全以该大学的名义发表文章，但未作硬性要求。从前述排名指标上看，他们这样做还真“见效”。

B.善用则为利器，滥用则为上吊绳

在自然科学与工程领域，测度单位和测度工具都很明确，例如，长度的单位是“米”，测度工具可以是低精度的卷尺，也可以是高精度的激光测距仪。在人文社科领域，测度单位往往都不能确定，比如，我们迄今不知道知识的单位是什么，测度方法自然也不成熟。

但是，现代社会的管理运行又需要我们“心中有数”，在这种情况下，用“指标”来近似地、替代地表征一个变量，就成为无奈却必需的选择。例如，我们想定量地比较不同国家的科技实力，目前还只能用论文数、论文被引用数、发明专利数之类的指标来近似反映。尽管不理想，但只要应用得当，相关指标仍能提供很多有用的信息，所以大家都在不同程度地设计和利用评价指标。

较好的评价指标，应能够显示出评价对象今后的努力方向。比如，20世纪90年代，澳大利亚科学与工业组织在确定优先领域的时候，考察了学术先进性与科研选题对本国社会经济发展的两个相关性指标，并分别以这两个指标为纵坐标与横坐标，将不同领域绘制在二维图上。这样，大家根据各领域在图上的位置一眼就能看出，澳大利亚的哪些研究领域应该比过去更加重视学术先进性，哪些领域更应关注相关性。

遗憾的是，当指标的评价对象是人或者机构的时候，某些人、某些机构不是根据指标评价结果来调整自己的努力方向，而是想办法来“就合”甚至操纵指标。这在世界各地都是个很严重的问题。比如前文所述的阿卜杜拉国王大学。一般说，水平较高的论文能够获得较多的引用。因此，若哪个大学拥有较多的高被引科学家，则该校的总体学术水平应该也比较高。面对这个指标，正确的做法是努力营造鼓励科研、鼓励创新的环境，吸引和培养更多的高水平人才。而阿卜杜拉国王大学却想出“挂名”这么个歪点子。

这种现象国内学者也不陌生。中国科学技术信息研究所采用多种指标来评价科技学术期刊的影响力，“基金论文比”是其中一个指标，指的是一种刊物每年发表的全部论文中，有多大百分比是重要科学基金或科技计划的资助成果。我们设计这个指标的大致思路是这样的：获得基金支持的科学家群体与未能获得基金支持的科学家群体相比，平均学术水平应该更高些；他们在较充足的经费支持下开展的研究，应比经费拮据的团队更易于出成果；这些科学家更愿意将自己的科研成果投稿给哪个刊物，其实是他们对刊物影响力的一个判断。应当说，这个思路是有道理的。遗憾的是，某些刊物不是通过自己的优质服务来吸引优秀作者，而是发出一个信号：凡是标注了基金支持的稿件，我们就优先录用。于是，某些作者为了使自己的稿件易于被接受，就胡乱标注基金支持信息：项目早就结题了，仍旧标注；论文的主题与项目主题基本无关，也进行标注，等等。于是，本来很好的一个指标被大大异化了。

C.对评价指标三点看法

对评价指标我有三点看法。

一、坚定信心，以自我评价为主。一个人也好，一个机构也好，如果上级不评价考核，我们对自己就没有要求吗？完全失去自信的人才会围着评价指标团团转。本人尽管一向表现很好，但自1985年成为本所的研究人员以来，迄今只有一次年终考核等次为“优秀”。我没有必要为了被评为“优秀”而“调整”做人方式，那可能越调整越糟糕。美式足球（橄榄球）并不是国际比赛项目，但美国人照样玩得不亦乐乎，因为美国人有自信。如果我们中国人不自信，就会放弃尚未成为奥运会比赛项目的武术而改练已经列入“评价指标”的拳击。正确的方略是：拳击可以练，武术不能丢。

二、管理人员要懂得定量评价的基本原则。基于指标的定量评价的基本原则是“同类比较”，因此，一定要讲究分类管理，分类评价，因为基础研究与应用研究不一样；自然科学与人文社会科学不一样；论文、专利、专著等成果在不同学科的地位不一样，等等。再好的指标，用一刀切的方式去实施，也会出大毛病。把罪过都归结于评价指标，归结于从事评价指标研究的科学计量学工作者，你说我们冤不冤？

三、提倡参与式的评价指标制定过程。如果管理者在制定评价指标时可以任意恣行，而被评价者只有俯首帖耳的份儿，那么，管理者欲达到的目标就很难达到，只能是南辕北辙的效果。无论是评价考核的频次、评价指标的选择、指标权重的设定等，都可以而且应该听取评价对象的意见。另外，应当将评价考核工作与职业生涯咨询结合起来。这样的话，评价指标就可能成为推动人才成长的利器，而不是千夫所指的靶子。

面对“就合”甚至“操纵”评价指标的乱象，我们不能因噎废食，简单化地完全弃用指标——凡是异化了的指标就都弃置不用，这就是因噎废食了。从事指标设计的研究人员和利用指标进行管理协调的行政人员，都应该根据指标应用的实际效果而不断调整优化相关指标。

当然，比这个更重要的，是被评价的科学家个人和各类组织的自重。实事求是乃是科研工作者的基本素质，面对评价指标，要从中看出自己的差距和努力方向，而不是像阿卜杜拉国王大学那样行事。

（作者为中国科学技术信息研究所研究员）

返回目录放大

缩小

全文复制下一篇