《中国社会科学报》郝若扬：如何测度学科核心作者

发布者：王珏发布时间：2016-09-20 浏览次数：2338

如何测度学科核心作者

郝若扬

核心作者是推动学术创新与学科发展的骨干力量，同时也是提升期刊学术影响力和竞争力的重要因素之一。通过对这一科研群体学术活动的挖掘和分析，可以有效识别不同学科的研究现状与发展脉络；而在人文社会科学领域，构建学术话语体系引导权，也离不开对核心作者群体的引导。因此，有效地测定出学科核心作者，是推动哲学社会科学繁荣发展、切实增强国家文化软实力的一项重要工作。

究竟采用何种方法和指标才能科学地测定某学科或领域内的核心作者？这一问题一直以来都是文献情报学研究讨论的热点。学者们就该问题的研究有较长的历史，且形成了一系列的经典理论和方法。目前，在测定核心作者的研究中，主要存在以下几种方法。

美国学者洛特卡（Lotka）最先研究了科学文献数量与作者数量之间的关系，并创造性地提出了“科学生产率”的概念。这是第一次定量地揭示了作者数量与文献数量之间的关系，从而创立了世界闻名的“洛特卡定律”（Lotka’s Law），即：写n篇论文的作者数量是写了1篇论文的作者数量的1/n2。随后，由于洛特卡定律在某些方面的疏漏，美国著名的科学史学家普赖斯（Price）在洛特卡定律的基础上进一步研究了科学家人数与科学文献数量之间的关联，注意到了精英对科学发展的巨大作用，以及不同能力层次的科学家之间的定量关系，于1963年在《小科学，大科学》一书中提出了“普赖斯定律”（Price’s Law）。他写道：“科学家的总人数，大致是按杰出科学家人数的平方增长的。”所谓普赖斯定律，即：在同一主题中，半数的论文是一群高生产力作者所写，这一作者集合约等于全部作者总数的平方根。普赖斯定律也可以表示为m≈0.749，其中nmax为杰出科学家中最高产作者发表论文数，m为杰出科学家中最低产作者发表论文数。据此，关于作者分布规律的研究形成了以洛特卡定律和普赖斯定律为核心的研究体系。其中，普赖斯定律确立了筛选科学界核心研究力量的有效方法。很多确定核心作者的研究都是基于普赖斯定律的，即：根据研究领域最高产作者的发文量来确定核心作者范围。

普赖斯定律所揭示的是从发文量角度寻找所谓“核心”作者，通过关注某领域科研成果的“量”，反映出该领域科学工作者的科研产出和活跃度。但作者的重要性和影响力仅凭其产出量测定具有一定的片面性，应在产出量的基础上考虑成果的重要性和影响力，也就是论文的质量。因此，合理的评价指标必须能够揭示这些科研成果深层次的“质”。随着此项研究的不断深入，多产作者等同于核心作者也受到越来越多的质疑，更多的学者认为在发文量的基础上还必须用另外一些能够揭示这些科研成果深层次“质”的指标。核心作者群应该指那些发表论文量较多且影响力较大的作者集合。随着图书情报界研究者在文献计量领域研究的深入发展，不断有新的科研绩效评价指标出现，这为衡量科学家个人学术成就提供了更多方法，也为测定核心作者提供了许多新的思路。20世纪50年代，美国著名情报学家尤金·加菲尔德（Eugene Garfield）博士在《科学》杂志上发表了《引文索引用于科学》一文，系统地提出了利用引文索引检索科技文献的新方法，打开了从引文角度来追踪科学发展动态的新领域，开启了引文分析的大门。此后，他和普赖斯在引文索引的基础上发展了引文分析的技术。引文分析方法的中心就是测算被引数量。该方法最先被广泛用于评价科研成果的质量和影响力方面，进而用以测定某领域内的核心作者。该方法也是推动核心作者研究从量到质转变的重要标志。

随后，在2005年，美国统计物理学家乔治·希尔施（Jorge Hirsch）提出用h指数来测评核心科学家，开创了学术评价新指标，立即引起了学术界的广泛兴趣和高度关注。一个学者的h指数是指他至多有h篇论文分别被引用了至少h次。华盛顿大学著名心理学教授勒迪格（Roedgier）认为：h指数奥妙之处在于通过一种简单的测量，且仅用一个单一指标值达到了描述生产率和影响力两方面的效果。该指标既能反映科学家学术论文的影响力大小，又能同时反映其重要论文产出数量的多少，因此可以用于衡量科学家个人学术成就。h指数的提出也为测定核心作者提供了新的思路。目前已有很多学科采用h指数法对主流科学家学术影响力进行测量研究与排序。如英国的奥本海姆（C. Oppenheim）和美国的克罗宁（B. Cronin）等分别利用h指数对英国和美国信息科学与图书馆学研究人员的成果进行排序和研究；荷兰莱顿大学著名文献计量学家拉恩（Raan）根据荷兰147个化学研究机构中的700名研究人员在1991—2000年间的论文产出情况，测算了化学领域核心作者，并对h指标与其他传统文献计量学指标及同行评议的相关性作了分析。我国学者邱均平、周春雷、缪雯婷等人采用h指数研究方法对国内图书情报学界进行全面系统的实证研究，筛选出了该领域影响力较大的作者。

h指数巧妙地规避了以往评价过程中的很多问题，它与传统的文献计量指标有较高的相关性。h指数作为一个累积指标，单纯论文数量的增长对该指标不会产生直接的影响，个别文章引文的增长也不带来某种必然的变化。但h指数也存在一些不足之处，如对高被引文章不敏感，对单纯论文数量的增长也不敏感等。h指数还具有只升不降的特点，因此无法反映科学家研究活动的衰退状况。另外，h指数还缺乏区分度，即使在相同的科学领域中，研究人员的h指数相同的情况也很普遍。采用h指数遴选核心作者的最大问题之一是其滞后性，这种特性虽然可以很好地用来评价科学家的终身成就，但研究高h指数的科学家只能有利于了解该领域的经典之作，却不一定有利于研究最新进展，也不适合用于评价年轻科学家。另外，对于研究交叉学科和边缘学科的科学家而言，用h指数常常很难界定其在特定研究领域的成就与贡献。因此，用h指数来遴选核心作者也存在一些不容忽视的问题。

通过对已有的核心作者遴选方法进行对比分析，不难发现，目前学者们在测评核心作者时并没有真正形成统一的标准，早期的测评方法多是利用单一指标。随着此项研究的深入，后来的研究者多采用综合指数的方法，如邱均平和周春雷通过发文量和h指数结合对图书情报学领域高影响力作者进行了评选方法研究；钟文娟基于普赖斯定律与综合指数法对《图书馆建设》期刊的核心作者做了测评研究。但这些典型的测评方法基本都是围绕着两个指标，即作者的发文量和被引量。将发文量作为筛选核心作者的指标，其主要原因有：一是按照普赖斯经典理论，发文量是科研活动的重要表现形式，能直观地反映出作者的学术活跃度；二是此指标简单、客观、容易获取。被引量之所以成为确定核心作者另一个不可替代的指标，是因为按照加菲尔德的观点，文献被引数量与作者的影响力呈正相关关系，论文被引用，说明它包含的信息或知识被人利用了，被引用的多少则可看作是对论文学术价值和水平的测度。目前被引量已作为一种比较可靠的指标被广泛用于科学产出的质量评价。但无论是发文量或是被引量（h指数是发文量与被引量的综合），依靠单一指标对核心作者进行测定，显然会存在不确定性和局限性，并不能完全反映作者在学科领域中的学术贡献和影响力。

因此，笔者认为在测定核心作者时应注意以下四点，也许能够更好地筛选出高影响力的领域专家。

一是除发文量和被引量外，论文所载或被引的期刊水平也可作为测定核心作者的一项重要指标。笔者认为，可通过目前国内普遍公认的三大人文社会科学权威评价机构（北京大学图书馆、中国社会科学院中国社会科学评价中心、南京大学中国社会科学研究评价中心）分别评选出并共同认定的核心期刊（含CSSCI来源刊）上发表的论文数量和被引数量，利用这两项指标共同确定论文的质与量。

二是除指标问题外，另一个必须注意的问题是学科分类。此前的各种研究方法在测评某学科或领域的核心作者时，都是以该学科专业期刊为统计样本进行指标的统计工作。笔者认为不应局限于使用某学科的专业期刊筛选核心作者，而应依据论文的学科类别作为测定核心作者的数据统计样本，这样涵盖作者的范围更广泛，筛选出的核心作者更准确。

三是应针对不同学科特点，合理地设置阈值，确定出的核心作者才更具有代表性和权威性。在确定某学科或领域核心作者前，一般先是根据普赖斯定律测定出核心作者的最低发文数量，划出核心候选人的范围。因此计算最低发文数量应根据学科特点设置阈值，阈值的设置应重点考虑学科大小和范围。

四是采用h指数测定核心作者，应全面考虑指标的局限性。h指数虽然是一个计算简单并且易于理解的复合指标，但考虑到h指数是累积指标，其优势在于测度科学家的持久绩效，比较适合用于衡量已从事科研多年的资深科学家的终生成就。除此之外，计算h指数时若选择的不同种类引文数据库的来源期刊数量和期刊的学科结构存在较大差异，那么某个科学家的h指数会因为所选取的数据库的不同而发生变化，不同学科间的学者的h指数也有较大差异。

（作者单位：中国社会科学院中国社会科学评价中心）