财经研究  2016, Vol. 42 Issue (10): 94-107     
0

文章信息

财经研究
2016年42卷第10期
唐莉, PhilipShapira, JanYoutie.
Tang Li, Philip Shapira, Jan Youtie.
中国科研成果的引用增长是否存在“俱乐部效应”?*
Is There a Clubbing Effect Underlying Chinese Research Citation Increases?
财经研究, 2016, 42(10): 94-107
Journal of Finance and Economics, 2016, 42(10): 94-107.

文章历史

收稿日期:2016-05-12
《财经研究》
2016第42卷第10期
中国科研成果的引用增长是否存在“俱乐部效应”?*
唐莉1, PhilipShapira2,3, JanYoutie2,4     
1.上海财经大学 公共经济与管理学院; 上海 200433;
2.佐治亚理工公共政策学院,亚特兰大 30308;
3.曼彻斯特大学 商学院,曼彻斯特 M139PL;
4.企业创新研究所,亚特兰大 30308
摘要: 越来越多的实证数据显示,中国科研发表的被引频次正在迅速上升。不同的解释相继提出。本研究探讨了另一种可能性—中国研究的被引频次激增是否存在"俱乐部效应",即高影响力的中国科研论文会有更高的内部援引率。以纳米技术这一交叉新兴领域作为研究素材,我们发现中国高被引论文在个体、科研机构以及国家三个层次上较大比例的引用来源于内部网络。描述性和统计检验表明,与美国同类论文相比,中国高被引论文的内部引用更为显著。文末就该"俱乐部现象"进行了诠释并提出相关政策建议。 ②本文中“互引俱乐部”、“俱乐部效应”、“俱乐部互引”互换使用。
关键词: 科研评估    科技政策    互引俱乐部    引文分析    
Is There a Clubbing Effect Underlying Chinese Research Citation Increases?
Tang Li1, Philip Shapira2,3, Jan Youtie2,4     
1.School of Public Economics and Administration, Shanghai University of Finance and Economics, Shanghai 200433, China;
2.School of Public Policy, Georgia Institute of Technology, Atlanta GA 30308, USA;
3.ManChester Business School, University of Manchester, Manchester M139PL, United Kingdom;
4.Enterprise Innovation Institute, Atlanta GA 30308, USA
Abstract: There is increasing evidence that citations to Chinese research publications are rising sharply. A series of reasons have been highlighted in previous studies. This research explores another possibility-whether there is a "clubbing" effect in China's surge in research citations, in which a higher rate of internal citing takes place among influential Chinese researchers. Focusing on the most highly cited research articles in nanotechnology, we find that a larger proportion of Chinese nanotechnology research citations are localized within individual, institutional, and national networks within China. Both descriptive and statistical tests suggest that highly cited Chinese papers are more likely than similar U.S. papers to receive internal and localized citations. Tentative explanations and policy implications are discussed.
Key words: research assessment    science and technology policy    clubbing effect    citation analysis    
一、 前言

中国在科学技术特别是在一些前沿学科领域的迅速崛起已成为不争的事实(Zhou和Leydesdorff, 2007;Adams, King和Ma, 2009)。汤森路透Web of Science(WoS)数据显示,中国的科研产出近年来增长迅速。2005年,中国科研发表排名仅为第五,位列美、英、德、日之后(OECD, 2007)。到2010年,中国已位列第二,紧随美国其后(Moiwo和Tao, 2013; Zhang, Patton和Kenney, 2013)。在国际发表引用率方面,《中国国家中长期科技发展规划》中提出的科学论文引用次数到2020年上升至世界前五的目标,已经在2012年提前实现(Bound, Saunders, Wilsdon和Adams, 2013)。随着中国科研发表质量和影响力日益提升, 中国的标准化引用虽然就整体而言仍低于美国和其他领先国家,但某些领域已经达到或接近世界科研影响力的平均水平。

分学科来看,中国科研被引频次在数学和农业领域相对较高,而在计算机、空间科学、生物化学、材料等领域过去十年则呈现强劲增长(Bound等, 2013; Moiwo和Tao, 2013)。在WoS收录的纳米科技论文中,2010年中国在数量上已位列全球第一(Zhou和Leydesdorff, 2007;Tang和Shapira, 2011a;Kostoff等, 2012)。中国在纳米技术领域的高被引—亦称“重量级”论文—的数量在不断增加(Kostoff,2012)。论文被引频次与世界其他领先国家的差距也在缩小(Youtie, Shapira和Porter, 2008;Hu和Rousseau, 2013)。

那么是什么原因推动了中国论文被引频次的增加?以往研究提出下述解释:1)中国研究本身的质量随着时间的推移不断提升,从而使得更好的论文得以发表在具有更高影响因子的期刊上,进而得到更多的引用(Guan和Ma, 2007;Appelbaum, Parker和Cao, 2011);2)中国数量庞大的科学家之间的激烈竞争推动了研究进步(Suttmeier, Cao和Simon 2006);3)海外华人在中国国际合作研究中扮演了重要角色。中国的知识中介者,通过与中美双方科研人员的持续深入合作,提高了中国的科研质量(Jin, Rousseau, Suttmeier和Cao, 2007; Tang 2013);4)随着中国英文发表文章的增多,以及汤森路透Web of Science数据库中所收录的中国期刊的增多,中国科研成果在国际学术舞台上的可见度有了提高(Ren和Rousseau, 2002;Lin和Zhang, 2007;Huang, Notten和Rasters, 2011);5)中国论文发表集中在物理学,生物科学和跨学科研究上,而这些领域由于自身学科特征更常被引用(Shapira和Wang, 2010);6)中国科研成果引用的迅速提升,得益于中国在各个层面特别是国际层面合作网络的迅速拓展(Adams等, 2009; Costas, van Leeuwen和Bordons, 2010)。

在这篇文章中,我们提出另一种可能性:与其他国家的同行相比,中国科研人员的研究更有可能被内部网络引用。以纳米技术为例,我们试图检验中国科研成果的被引频次增长是否存在“互引俱乐部”效应。文章的结构安排如下:我们首先简要回顾引文分析中的有关自引和“俱乐部效应”的研究;接下来是关于本文数据来源和研究方法的描述;然后我们以中美高被引纳米科技论文为例,探析影响被引频次的因素,并运用回归模型来检验“俱乐部效应”的国家差异性。在文章最后,我们对分析的结果进行尝试性解释,讨论该研究结果的局限性与相关政策意义。

二、 研究背景

引文中的“俱乐部效应”

“俱乐部效应”这一概念最初出现在关于精英科学家大量引用对方成果的研究中(Opsahl,Colizza,Panzarasa和Ramasco,2008),广义上也被用于描述主流科研人员及社群之间互相引用的现象(Colizza等, 2008)。在本文中,我们着眼于中国高被引论文被引的“俱乐部效应”,并将其与美国同行作比较,检测“俱乐部互引”是否存在国别差异。在具体测度之前,我们先回顾一下对自引影响的相关讨论。

引用和自引

科技评价领域一般认同被引频次能够基本反映该研究的质量或者更严谨地说反映该研究的知名度或学术影响(Garfield, 1979; Redner, 1998)。以往的引文分析常把自引——作者引用自己的研究(Noyons,Moed和Luwel,1999;Moed,2002)——作为分析其国际学术影响力的噪音。这一点在文献计量学界有着广泛讨论。一些学者认为自引频次显著影响了文章的被引结果,呼吁在测量影响因子时应剔除自引。Van Raan(1998)的研究发现合作论文,特别是国际合作科研论文的自引比例更高。Hall,Jaffe和Trajtenberg (2001)的研究进一步指出,由于引文本身的延续性和被引频次计算的截断性,新发表文章的自引比例更大。

也有学者持不同见解。如Glänzel 、Meyer等认为在宏观层面上或当论文样本足够大时,没有必要剔除自引(Pichappan和Sarasvady, 2002;Glänzel和Meyer, 2003;Glänzel和Thijs, 2004a)。Bonzi和Snyder(1991)的一项问卷调查显示,科研人员引用自己论文或他人论文的动机不存在显著差异。Persson, Glänzel和Danell (2004)认为,合作论文的自引率对引用膨胀现象的影响递减。基于1991年至1999年自引数据的分析,他们发现,不仅自引的绝对数量增加幅度小于他引,其占所有被引次数的相对份额也随着时间的推移略有下降。Rehn和Kronman (2008)解释说,这种下降可能是因为学者还是主要根据论文的质量决定是否引用。二人在文章中还进一步推测美国学者的自引高于国际平均水平。Gedik(2012)综合以上两种对于自引的不同观点提出,当使用被引频次来测量知识溢出和内化时,是否要剔除自引值得商榷。如果在引文分析中包括自引,可能会高估知识溢出的影响;反之剔除自引,知识溢出则会被低估。

总体而言,国际上精英学者互相引用的“俱乐部效应”研究相对很少。个别例外的研究包括同组引用偏好在语言和期刊层面上的体现。如Yitzhaki等学者设计了母语偏好指标来描述同一语言群体之间的互引偏好(Bookstein和Yitzhaki, 1999; Egghe, Rousseau和Yitzhaki, 1999)。Ren和Rousseau (2002)聚焦美国科学信息研究所ISI收录的18个物理与化学领域的中国期刊,发现许多中国期刊的施引文献来自于其他中国期刊。之后,Egghe和Rousseau(2004)基于不平等理论和加权洛伦兹曲线,提出了衡量同组偏好的研究框架。但已有研究仍未能回答以下两个问题: 1)引文“俱乐部效应”在多大程度上影响个人微观、机构中观和国家宏观层面的总体引用状况;2)俱乐部互引的影响程度是否存在国家差异?

三、 研究方法

数据

我们结合文本挖掘和回归分析方法,以纳米科技论文为例,聚焦中美两国“重量级”即高被引论文,尝试对以上问题进行初步分析。之所以选择纳米科技领域,是因为中国在该跨学科领域研究的数量和影响近年来迅速崛起;而聚焦“重量级”论文,是因为高被引论文虽然为数不多却占据着被引频次的相当大比重(Lotka, 1926;Allison和Stewart, 1974;Phelan, 1999;Kostoff, 2012)。

我们的数据由两部分组成。一部分是“重量级”论文(被引文献),另一部分则是所有引用这些“重量级”论文的文章(施引文献)。我们使用美国佐治亚理工学院的全球纳米科技文献数据库来识别被引文献。关于该数据库的创建(包括多阶段布尔搜索策略)的详细信息,请参考Porter等(2008)和Youtie等(2008)的研究。我们选择了中国和美国这两个发表论文最活跃的国家,分别识别下载了其2000年、2004年和2008年引用排名前20的纳米论文,累计120篇“重量级”种子文章(即20×3×2=120篇)。

①在这篇文章中,中国仅限于对中国大陆、香港和澳门特区的数据分析。

被引文献三个时间点的选择基于以下考虑:2000年科研发表反映两国国家纳米科技发展计划出台前该领域发展状态。第二个时间点代表了中、美两国纳米科技论文发表稳健增长时期。最后一个时间点则代表了全球纳米科技论文发表量快速增长时期。我们通过2008年的样本来把握纳米领域最近的发展成果,这样每篇高被引文章至少有两年时间可观察被引用的频次。施引文献的完整文献数据(总计62 338条)于2011年9月下载,并与120篇重量级高被引文章进行了矩阵匹配。高被引文章的选取限于纳米科技的原创研究论文。为观察到中美高被引文章引用模式是否在不同研究领域也存在差异,选择时并不区分其具体涉及的领域。

②数据清理中多重引用的施引文献中被识别并剔除。即如果文章P1引用多篇“重量级”文章,那么施引文献P1只在中国的施引数据中出现一次。

对于施引文献数据的处理,我们按照业内的常用做法包括了以下三类文章:原创研究论文、综述文章和读者来信。其他类型的文档(如会议摘要、会议文章、论文更正等)不包括在分析数据之内。我们首先用Vantage Point软件进行多轮数据清理和标准化操作,包括自动人名匹配算法和最后的人工校验匹配(Tang和Walsh,2010)。

Vantage Point是文献计量学和专利数据库的文本挖掘工具;更多内容详见http://www.thevantagepoint.com

四、 结果分析

基本描述

首先,数据显示所有120篇高被引论文都用英文发表。这一发现在意料之中;无疑,同等质量的英文文章比其他语言书写的文章更容易被引用(Hu, Carley和Tang, 2012; Liang, Rousseau和Zhong, 2013)。虽然WoS数据库本身的局限性之一就是所涵盖的非英语期刊份额较少,但英语是目前全球科学界最重要的沟通语言这一事实无可争议。

其次,美国学者在中国高被引纳米科技文章发表中起着重要作用。在中国被引次数最多的60篇纳米科技论文中,有24篇论文是与境外学者合作而成,其中13篇至少有一位合作者来自美国。与之形成鲜明对比的是,没有一个美国高被引纳米技术论文中有来自中国的合作者。

表 1比较了中美的合作概况。与Aksnes(2003)的研究结果相呼应,我们发现高被引纳米论文通常涉及多个作者、多个科研单位,且常常涉及国际层面的合作。在篇均论文作者数上,美国中位数为6,中国为5。但是中国学者比美国同行更倾向于跨机构和跨国合作(表 1)。

表 1 重量级纳米文献合作概况:中国vs美国
样本数=120
合作作者人数 合作机构数 合作国家数 累计被引频次
最小值 均值 中数 最大值 最小值 均值 中数 最大值 最小值 均值 中数 最大值 最小值 均值 中数 最大值
中国 2 6.8 5 64 1 2.3 2 33 1 1.6 1 11 43 217.4 193.5 576
美国 2 11 6 192 1 2.2 1 12 1 1.3 1 5 90 614.4 493.5 2 362
注:重量级论文在本研究中指的是在纳米技术领域中国、美国分别在2000年、2004年和2008年发表的截至2011年9月引用频次最高的共计120篇文章。

120篇高被引文章的篇均被引416次(标准方差为43),被引次数从43到2 362不等。引用来源不乏重要期刊,如《自然》(该期刊2011年影响因子36.28)以及特定领域刊物,如《固态通讯》(2011年期刊影响因子1.65)。表 2列出了中美高被引文章的五大刊登杂志。如表所示,中美比较组在研究主题类别和出版刊物方面仍颇具可比性。

表 2 重量级纳米文献的研究主题类别和出版刊物:中国vs 美国
排名 前五位研究主题类别 前五位出版期刊
中国 美国 中国 美国
1 化学, 交叉学科 交叉学科 美国化学会志 科学
2 材料, 交叉学科 化学, 交叉学科 应用物理学快报 自然
3 应用物理 材料, 交叉学科 德国应用化学 美国化学会志
4 物理化学 纳米科学与技术 自然 纳米快报
5 交叉学科 应用物理 科学 自然-纳米技术

信息来源:汤森路透公布的期刊引证报告(2011版); 更多内容详见http://wokinfo.com/products_tools/analytical/jcr/

接下来我们分析“重量级”纳米科技论文的引文分布。表 3显示②③:1)美国论文在引文绝对数量方面远超中国。2)中国引文增长很快。即便由于引用次数统计截断的影响,中国高被引文章2004年的引用总数(即2004-2010年间的引用)超过了其2000年组的引用总数(即2000-2010年间的引用)。3)尽管美国论文引用的中国“重量级”论文的数量有波动,但其所占引用中国文献的比例却从2000年的16%到2004年的17%,再到2008年的22%,呈现逐年增加趋势。我们并没有在美国的“重量级”论文的施引文献中找到相同规律。这可能意味着我国高质量的纳米研究在美影响力与日俱增。4)相比美国论文,中国论文被本国文章引用的比重显著更大。如表 3所示,在引用中国“重量级”文章的施引文献中,有52%的文章有作者来自本国,然而在美国,这一数值仅为36%。

表 3 引用分布:中国vs美国
发表
年份
累计被
引频次
国内引
用频次
国际引
用频次
施引国别(百分比)
美国 中国 第三国
美国 2000 18 205 6 333 11 872 6 333 35% 4 140 23% 9 771 54%
2004 10 196 3 498 6 698 3 498 34% 2 789 27% 5 216 51%
2008 8 465 3 407 5 058 3 407 40% 1 671 20% 4 703 55%
合计 36 866 13 238 23 628 13 238 36% 8 600 23% 19 690 53%
中国 2000 4 520 2 136 2 384 743 16% 2 136 47% 2 102 47%
2004 5 259 2 988 2 271 902 17% 2 988 57% 2014 38%
2008 3 266 1 627 1 639 727 22% 1 627 50% 1 416 43%
合计 13 045 6 751 6 294 2 372 18% 6 751 52% 5 532 42%

②我们施引文献数据库中“国家”域的有效数据为99%。表 3数据的计算建立在该域的有效值上。

③第三国指的是非美国、非中国的其他国家。因为本文采取的是整计数法whole counting来分配文章隶属关系。施引文献可以包括中国或美国,但必须有一个第三国的作者参与贡献。

研究同时发现:中国文献“互引俱乐部”现象并不仅仅局限于国家层面;在中观机构和微观个人层面的表现也很明显。图 1的箱线图描绘了中美两国在个人、机构和国家层次上的内部引用比例。

图 1 互引俱乐部效应的箱线图(0=美国,1=中国)

如图所示,中国文献引用的箱线图(除2008年机构层面之外)都比美国对照组长,显示出中国引文的“俱乐部效应”总体较美国更强的异质性。此外,中国所有箱线图的位置都明显高于美国同类,表明相比美国同行,中国研究人员在个人、机构和国家层面都更加广泛地引用自己的科研成果。

回归分析

描述性统计表明,中国纳米科技研究在个体、机构和国家三个层面上的内部引用较美国更为明显。接下来检验当我们控制其他干扰因素(如研究领域,合作程度和年份等)时,这些差异是否依然存在。

我们的原假设非常简单:

H0:中国论文的“互引俱乐部效应”比美国更明显。

备择假设是:

H1:中美两国论文的“互引俱乐部效应”不存在统计学意义上的差异。

回归模型:Yi=Xi+εi

其中Yi代表“俱乐部效应”,Xi是影响Yi的因子构成的向量,εi是误差项。表 4是模型中的变量和测度方法。

表 4 变量描述
变量 代码 测度
俱乐部效应 CLUB_PERSON 主要作者(第一作者和通讯作者)的自引占所有引用比重
CLUB_INST 同机构文章的内部引用占所有引用的比重
CLUB_CTRY 本国的内部引用占所有引用的比重
高被引论文国别 HCP_CTRY 1如果至少有一位作者来自中国, 否则为0
中美科研合作 US_CNCOL 1如果有作者来自中国和美国, 否则为0
第三国家合作 OTHCOLLAB 1如果至少有一个第三国作者参与,否则为0
合作范围 AUTHORS 合作作者数(合作者数量)
AFFILIATIONS 合作科研机构数(文章作者所从属的不同的机构数量)
COUNTRIES 合作国家数(合作作者所从属的不同国家数量)
学科领域 SUBJECT F1-F5:宏观学科代码
发表年份 PUB_YEAR 发表年份取值=2000, 2004, 或2008

测量

因变量。我们从三个维度(微观,中观和宏观层面)测量内部引用的“俱乐部”效应。对于每篇高被引文章,我们计算以下数值:

●作者的自引占所有引用的比重(这里的作者只限于主要作者,即第一作者和通讯作者);

●同机构文章的内部引用占所有引用的比重;

●本国内部引用占所有引用的比重。

这三个因变量的取值都在0到1之间。由于众所周知的人名歧义的问题(Galvez和Moya-Anegon, 2007;Onodera等, 2011),在研究个体层次的互引“俱乐部效应”时,我们只分析主要作者的情况。

自变量。我们的解释变量是“重量级”文章的国别。本文中该虚拟变量值为1,如果“重量级”文章涉及至少一名中国学者;否则为0。

控制变量

合作范围。被引频次和与内部引用(国家/机构/个人)的占比分布是多种因素作用的后果。比如Glänzel和Thijs(2004b)发现,合作者数量对自引的影响比它对他引的影响小。Costas等(2010)发现,研究中心的数量与个人自引呈正相关。借鉴前人研究结果,我们使用以下三个变量来测度合作范围:合作科研机构数(文章作者所从属的不同的机构数量)、合作作者数(合作者数量)、合作国家数(合作作者所从属的不同国家数量)。

国际科研合作。在积极开展国内研究活动的同时,中国在国际科研合作舞台上日趋活跃。以往的研究表明,国际合作特别是中美合作与中国科技文献的累计引用次数正相关(Tang和Shapira, 2011b;2012)。为控制国际合作因素的影响,我们在回归模型中加入两个虚拟变量US_CNCOL(中美合作)和OTHCOLLAB(第三国合作)。

研究领域。引文分布特征在不同研究领域差异很大(Snyder和Bonzi, 1998)。在本文我们采纳Porter等的宏观学科识别法(Porter和Rafols, 2009;Porter和Youtie, 2009;Garner, Porter, Borrego, Tran和Teutonico, 2013),将其应用到我们的施引文献数据库中来控制不同研究领域对引文的影响。分析显示,引文样本涵盖了五大宏观学科:生物医学、物理科学与技术、环境科学与技术、心理学和神经学以及计算机科学与工程(少量的社会科学类因在研究范围之外未包含在分析内)。据此,我们产生一组五个虚拟变量,并将它们添加到回归模型中以控制研究领域的影响。

发表年份。任何研究在受到大众注意之前,通常都会先被本研究团队或联系密切的团队所引用(Gupta, Campanha和Pesce, 2005)。考虑到这一同组引用的时间维度效应,我们在回归模型中添加了两个关于出版年份的虚拟变量。基准年是2000年。描述性和相关性统计指标都表明无多重共线性的担忧(参见表 5表 6)。AFFILIATIONSCOUNTRIES两个变量高度相关,但由于它们出现在不同模型中,所以这种相关性并不会影响回归。

表 5 描述性统计
变量 编码 均值 方差 最小值 最大值
俱乐部效应 CLUB_PERSON 0.05 0.05 0.00 0.35
CLUB_INST 0.11 0.09 0.01 0.49
CLUB_CTRY 0.46 0.17 0.10 0.98
重量级论文国别 HCP_CTRY 0.50 0.50 0 1
中美合作 US_CNCOL 0.11 0.31 0 1
第三国合作 OTHCOLLAB 0.21 0.41 0 1
合作范围 AUTHORS 8.93 19.59 2 192
AFFILIATIONS 2.25 3.30 1 33
COUNTRIES 1.47 1.14 1 11
表 6 关联矩阵
变量编码 1 2 3 4 5 6 7 8 9
1.CLUB_PERSON 1.00
2.CLUB_INST 0.58 1.00
3.CLUB_CTRY 0.34 0.31 1.00
4.HCP_CTRY 0.24 0.50 0.46 1.00
5.US_CNCOL 0.10 0.19 -0.20 0.35 1.00
6.OTHCOLLAB 0.16 0.30 -0.11 0.06 0.02 1.00
7.AUTHORS -0.13 0.06 0.04 -0.11 0.03 0.29 1.00
8.AFFILIATIONS -0.07 0.39 -0.16 0.02 0.28 0.43 0.49 1.00
9.COUNTRIES 0.03 0.40 -0.25 0.13 0.45 0.62 0.36 0.88 1.00

回归结果

分布密度图显示因变量数值服从广义线性模型(GLM)分布。考虑到三个结果变量的分布和性质,我们采用Papke和Wooldridge(1996)提出的LOGIT分位数回归。我们运用STATA 12版进行建模。如表 7所示,“互引俱乐部效应”的国家差异性(HCP_CTRY)显著。相对于美国同行,中国的高被引文章更倾向于引用本国、其所在科研机构以及自己的研究成果。稳健性测试中的多变量回归分析MANOVA的回归结果与GLM结果类似(如表 7所示)。模型对应的p值均小于0.0001。结果变量CLUB_PERSONCLUB_INSTCLUB_CTRY的方差解释率为14%,46%和42%。我们并没有观察到研究学科、出版年份、国际科研合作或合作范围等其他因素对引用俱乐部效应的显著性影响。

表 7 回归结果
GLM MANOVA
CLUB_
PERSON
CLUB_
INST
CLUB_
CTRY
CLUB_
PERSON
CLUB_
INST
CLUB_
CTRY
HCP_CTRY 0.473 *
(2.54)
0.910***
(5.04)
0.736***
(6.27)
HCP_CTRY 0.022
(1.960)
0.0849 ***
(5.480)
0.196 ***
(6.410)
AUTHORS -0.0288 **
(-2.59)
AUTHORS -0.000
(-1.18)
-0.001
(-1.91)
0.001
(1.600)
AFFILIATIONS 0.0432 ***
(5.07)
AFFILIATIONS -0.003
(-0.74)
0.0155 **
(3.200)
0.0214*
(2.240)
COUNTRIES -0.304 ***
(-3.69)
COUNTRIES 0.003
(0.230)
-0.020
(-1.31)
-0.126 ***
(-4.20)
OTHCOLLAB 0.524 *
(2.11)
0.371
(1.95)
0.209 (0.98) OTHCOLLAB 0.028
(1.780)
0.0489 *
(2.260)
0.064
(1.490)
pub_year2 0.288
(1.47)
0.179
(1.08)
0.114
(0.95)
pub_year2 0.013
(1.190)
0.011
(0.710)
0.021
(0.690)
pub_year3 0.225
(0.93)
0.239
(1.60)
0.269 *
(2.08)
pub_year3 0.010
(0.850)
0.018
(1.100)
0.032
(0.990)
Discp2 0.0395
(0.15)
0.0115
(0.05)
-0.0422
(-0.26)
Discp2 0.002
(0.160)
-0.002
(-0.11)
-0.002
(-0.06)
Discp3 0.0794
(0.32)
-0.0487
(-0.25)
-0.106
(-0.81)
Discp3 0.004
(0.270)
-0.011
(-0.58)
-0.022
(-0.57)
Discp4 -0.310
(-1.27)
0.231
(1.06)
-0.0853
(-0.51)
Discp4 0.015
(-0.96)
0.024
(1.090)
-0.012
(-0.28)
Discp5 -0.577
(-1.29)
-0.703 *
(-2.01)
0.0326
(0.08)
Discp5 -0.022
(-0.84)
-0.058
(-1.61)
0.021
(0.300)
_cons -3.296 ***
(-14.47)
-3.010 ***
(-20.40)
-0.251 *
(-2.27)
_cons 0.0312 *
(2.390)
0.0477 **
(2.640)
0.456 ***
(12.790)
N 120 120 120 N 120 120 120
注:括号内为t statisticsGLM:广义线性模型;MANOVA:多变量线性回归;*表示p < 0.05,**表示p < 0.01,***表示p < 0.001。
五、 讨论和总结

主要发现

该研究旨在进一步理解中国的科研论文被引频次激增的原因。如在文初所述,中国引文的快速增长有多方面诠释。主流观点包括:论文被引频次的增长是中国科学影响力崛起的有效表征。该观点成立的前提假设是引用行为的选择基于文献的相关性和质量。还有学者认为,引文增长可能是因为中国研究成果数量的增长或国际科研合作带来研究质量提升的后果。

我们的研究从谁引用的视角发现,中国论文引用存在较强的“俱乐部互引”效应,从而提出了中国学术影响力快速上升的另一个可能性解释。描述性和统计检验都表明,中国的高被引论文较美国同类更有可能被中国本土或同研究机构的文章或作者自己的其他研究引用,即中美高被引论文的内部引用在所有三个层面上都存在显著差异。

该现象有以下可能性解释。首先,中国的科技评价体系正在经历明显转型,但其对WoS索引期刊、高影响因子期刊和文章被引次数依然并日益看重(中国教育报,2012)。这一评价标准激励中国科研人员在WoS索引刊物上发表文章(Hvistendahl,2013),并设法提高论文的被引频次。而内部引用则无疑是最简捷便利的实现途径。中国社会人际关系的重要性可能使得研究人员引用同事、熟人或对其评审和升职有重要作用的国内学术领袖的研究成果。其次,中国科研资助的命题导向,使得科研成果往往高度集中在某些特定研究议题,从而导致中国“互引俱乐部”效应更加明显。Wang(1992)和Tang(2007)的研究指出,为迎合资助机构提出的研究命题,一些研究人员转向从事指定热点课题的研究方向。无疑,当越来越多的中国科研人员在研究相同或相似课题时,他们之间的内在互引的概率自然会增加。我们的回归模型显示宏观学科对“俱乐部”效应的影响在统计学意义上并不显著,但若能采用更精确的学科或具体研究领域界定的方法,则有可能发现该影响的作用。

当然,中国科研发表引用的“互引俱乐部”效应并非是故事的全部。而且“俱乐部效应”的发现也并不与中国科研引文增长现象的其他解释相违背。我们的数据分析显示,在中国高被引纳米技术研究的国际合作者中,美国学者占大多数;与此同时,美国学者对中国纳米技术研究的引用呈逐年增加态势。Kostoff (2012)的一项研究表明,中国“重量级”研究的发表直接导致其整体引用量的快速增长。换言之,除了中国科研国际发表本身数量增加的缘故,中国“重量级”高影响力研究的存在也造成了外部引用纷至沓来。从这个意义上讲,该研究进一步从实证上支持了Kostoff(2012)的研究发现。

除了用来衡量国际学术影响力,论文的引用也常用来捕捉不同学术主体间知识流动的轨迹(Jaffe, Trajtenberg和Henderson, 1993;Cronin和Overfelt, 1994;Chen和Hicks, 2004)。我们的研究表明,中国高被引论文更大程度的内部引用(即较美国同类更大比例的引用源自本人、所在机构和本国)可能说明了在个人研究议题的延续性、组织内部或之间学术交流和知识溢出方面中国表现较美国更为出色。

局限性与未来研究方向

必须承认该研究存在诸多不足之处。首先,作者姓名消歧和高被引论文的庞大施引文献所带来的种种困难使得我们不得不控制引用源的规模,使其处于可清理操作范围内。由此产生的年份选择与样本量较小都限制了研究结果适用的普遍性。今后的研究可进一步扩展被引样本的规模,当然我们应意识到样本扩大也会随之带来平均引文质量的衰减。其次,我们的研究没有发现学科领域和时间指标对“俱乐部效应”的显著影响。在未来研究中,随着样本容量的增加,更精准的变量测量方式可能会产生显著性差异。最后,本文对中美引文“俱乐部效应”的比较研究仅建立在二手资料的分析上,访谈或其他一手数据的分析将有利于进一步探讨中美研究人员内部引用倾向差异的成因。此外,深入研究在美华人科研网络及其对日益增长的美国对华引用现象的影响也是值得进一步探讨的议题。

政策建议

波普尔指出,在理想情况下,科学知识的生产、积累和交换应该在开放的平台进行(Popper,1963),但制度因素对知识进步的影响早也是众所周知(Kuhn,1970)。无疑,内部引用是科学探索进程中不可或缺的元素。重要的科研成果不论在哪儿发表或被谁引用,都应该得到人们的认可。而自引(或广义上的内部引用)对如何评估超出原有知识提供者之外的知识流动也带来挑战(Costas等,2010)。在评价科学家个体、科研机构甚至国家的科研表现和影响力时,我们应怎样评估内部引用及其带来的影响值得思考。这个问题正随着新兴经济体在国际科研领域所占比重的不断增加而变得越发重要。

中国科研成果近年来在国际发表上取得令人瞩目的成绩:科研发表数量和被引频次的大幅提升引起全球范围内的广泛关注。中国科研体系的庞大规模,科技工作者的可观数目与迅速增长,促使人们不禁思考:中国论文之间的互引到底是怎样、在多大程度上影响国家科研产出和学术影响力?单一依赖引用次数来评估研究影响力的弊端已经得到广泛讨论。但尽管负面引用,过度自引,甚至有被引潜力的论文的买卖(Hvistendahl,2013)等现象引起了学界的关注,大多数研究仍然选择忽略引用的时间维度和情境特性,将所有引用视为等同、不加区分对待(King, 2004; Taylor, Perakakis和Trachana, 2008;Cardillo等, 2013)。

我们的研究从国家角度出发,给出了有关引文来源异质性的一些证据。我们强调,取决于具体应用场景,对引用频次的简单计数可能会掩盖某些重要发现。当前,单一的定量评价(如发表数量、刊物排名和论文引用量等)正日益成为决定科研经费和人员晋升的标准(Lawrence,2003;2007)。我们的研究结果呼吁对单一的以量化指标来评估研究的影响应持谨慎态度。评估方法的选择可能会反过来影响到科研人员的行为。

主要参考文献
[1] Adams J, King C, Ma N. Global research report-China: Research and collaboration in the new geography of science[EB/OL]. http://www.tumj.ir/pdf/globalresearchreport.pdf,2009.
[2] Aksnes D W. Characteristics of highly cited papers[J]. Research Evaluation , 2003, 12 (3) : 159–170. DOI:10.3152/147154403781776645
[3] Allison P D, Stewart J A. Productivity differences among scientists: Evidence for accumulative advantage[J]. American Sociological Review , 1974, 39 (4) : 596–606. DOI:10.2307/2094424
[4] Appelbaum R P, Parker R, Cao C. Developmental state and innovation: Nanotechnology in China[J]. Global Networks , 2011, 11 (3) : 298–314. DOI:10.1111/j.1471-0374.2011.00327.x
[5] Bonzi S, Snyder H W. Motivations for citation: A comparison of self citation and citation to others[J]. Scientometrics , 1991, 21 (2) : 245–254. DOI:10.1007/BF02017571
[6] Bookstein A, Yitzhaki M. Own-language preference: A new measure of "relative language self-citation"[J]. Scientometrics , 1999, 46 (2) : 337–348. DOI:10.1007/BF02464782
[7] Bound K, Saunders T, Wilsdon J, et al. China's absorptive state: Research, innovation and the prospects for China-UK collaboration[M]. London: Nesta, 2013 .
[8] Cardillo A, Gómez-Gardeñes J, Zanin M, et al. Emergence of network features from multiplexity[J]. Scientific Reports , 2013, 3 : 1344.
[9] Chen C M, Hicks D. Tracing knowledge diffusion[J]. Scientometrics , 2004, 59 (2) : 199–211. DOI:10.1023/B:SCIE.0000018528.59913.48
[10] China Education Daily. Reforms and innovations on research evaluations[EB/OL]. http://paper.jyb.cn/zgjyb/html/2012-07/19/content_74337.htm,2012.
[11] Colizza V, Flammini A, Serrano M A, et al. Detecting rich-club ordering in complex networks[J]. Nature Physics , 2006, 2 (2) : 110–115. DOI:10.1038/nphys209
[12] Costas R, van Leeuwen T N, Bordons M. Self-citations at the meso and individual levels: Effects of different calculation methods[J]. Scientometrics , 2010, 82 (3) : 517–537. DOI:10.1007/s11192-010-0187-7
[13] Cronin B, Overfelt K. Citation-based auditing of academic performance[J]. Journal of the American Society for Information Science , 1994, 45 (2) : 61–72. DOI:10.1002/(ISSN)1097-4571
[14] Egghe L, Rousseau R, Yitzhaki M. The "own-language preference":Measures of relative language self-citation[J]. Scientometrics , 1999, 45 (2) : 217–232. DOI:10.1007/BF02458434
[15] Egghe L, Rousseau R. How to measure own-group preference? A novel approach to a sociometric problem[J]. Scientometrics , 2004, 59 (2) : 233–252. DOI:10.1023/B:SCIE.0000018531.24886.00
[16] Galvez C, Moya-Anegón F. Approximate personal name-matching through finite-state graphs[J]. Journal of the American Society for Information Science and Technology , 2007, 58 (13) : 1960–1976. DOI:10.1002/(ISSN)1532-2890
[17] Garfield E. Citation indexing: Its theory and application in science, technology, and humanities[M]. New York: John Wiley & Sons, 1979 .
[18] Garner J, Porter A L, Borrego M, et al. Facilitating social and natural science cross-disciplinarity: Assessing the human and social dynamics program[J]. Research Evaluation , 2013, 22 (2) : 134–144.
[19] Gedik Y. Geographical localisation of knowledge spillovers by Australian patent citations[J]. Economic Papers , 2012, 31 (2) : 173–181. DOI:10.1111/ecpa.2012.31.issue-2
[20] Glänzel W, Meyer M. Patents cited in the scientific literature: An exploratory study of 'reverse' citation relations[J]. Scientometrics , 2003, 58 (2) : 415–428. DOI:10.1023/A:1026248929668
[21] Glänzel W, Thijs B. The influence of author self-citations on bibliometric macro indicators[J]. Scientometrics , 2004a, 59 (3) : 281–310. DOI:10.1023/B:SCIE.0000018535.99885.e9
[22] Glänzel W, Thijs B. Does co-authorship inflate the share of self-citations[J]. Scientometrics , 2004b, 61 (3) : 395–404. DOI:10.1023/B:SCIE.0000045117.13348.b1
[23] Guan J C, Ma N. China's emerging presence in nanoscience and nanotechnology:A comparative bibliometric study of several nanoscience 'giants'[J]. Research Policy , 2007, 36 (6) : 880–886. DOI:10.1016/j.respol.2007.02.004
[24] Gupta H M, Campanha J R, Pesce R A G. Power-law distributions for the citation index of scientific publications and scientists[J]. Brazilian Journal of Physics , 2005, 35 (4a) : 981–986. DOI:10.1590/S0103-97332005000600012
[25] Hall B H, Jaffe A B, Trajtenberg M. The NBER patent citations data file: Lessons, insights and methodological tools[R]. NBER Working Paper No.8498, 2001.
[26] Hu G, Carley S, Tang L. Visualizing nanotechnology research in Canada: Evidence from publication activities, 1990-2009[J]. The Journal of Technology Transfer , 2012, 37 (4) : 550–562. DOI:10.1007/s10961-011-9238-3
[27] Hu X J, Rousseau R. Are Chinese nanoscience citation curves converging towards their American counterparts[J]. Malaysian Journal of Library & Information Science , 2013, 18 (3) : 49–56.
[28] Huang C, Notten A, Rasters N. Nanoscience and technology publications and patents: A review of social science studies and search strategies[J]. The Journal of Technology Transfer , 2011, 36 (2) : 145–172. DOI:10.1007/s10961-009-9149-8
[29] Hvistendahl M. China's publication bazaar[J]. Science , 2013, 342 (6162) : 1035–1039. DOI:10.1126/science.342.6162.1035
[30] Jaffe A B, Trajtenberg M, Henderson R. Geographic localization of knowledge spillovers as evidenced by patent citations[J]. The Quarterly Journal of Economics , 1993, 108 (3) : 577–598. DOI:10.2307/2118401
[31] Jin B, Rousseau R, Suttmeier R P, et al. The role of ethnic ties in international collaboration: The overseas Chinese phenomenon[A]. Torres-Salinas D, Moed H F. Proceedings of the ISSI 2007: 11th International Conference of the International Society for Scientometrics and Informetrics[C]. Madrid: CSIC, 2007: 427-436.
[32] King D A. The scientific impact of nations[J]. Nature , 2004, 430 (6997) : 311–316. DOI:10.1038/430311a
[33] Kostoff R N. China/USA nanotechnology research output comparison-2011 update[J]. Technological Forecasting and Social Change , 2012, 79 (5) : 986–990. DOI:10.1016/j.techfore.2012.01.007
[34] Kuhn T S. The structure of scientific revolutions[M]. Chicago: University of Chicago Press, 1970 .
[35] Lawrence P A. The politics of publication[J]. Nature , 2003, 422 (6929) : 259–261. DOI:10.1038/422259a
[36] Lawrence P A. The mismeasurement of science[J]. Current Biology , 2007, 17 (15) : R583–R585. DOI:10.1016/j.cub.2007.06.014
[37] Liang L, Rousseau R, Zhong Z. Non-English journals and papers in physics and chemistry: Bias in citations[J]. Scientometrics , 2013, 95 (1) : 333–350. DOI:10.1007/s11192-012-0828-0
[38] Lin M, Zhang J. Language trends in nanoscience and technology: The case of Chinese-language publications[J]. Scientometrics , 2007, 70 (3) : 555–564. DOI:10.1007/s11192-007-0302-6
[39] Lotka A J. The frequency distribution of scientific productivity[J]. Journal of the Washington Academy of Sciences , 1926, 16 (12) : 317–323.
[40] Moed H F. Measuring China's research performance using the Science Citation Index[J]. Scientometrics , 2002, 53 (3) : 281–296. DOI:10.1023/A:1014812810602
[41] Moiwo J P, Tao F. The changing dynamics in citation index publication position China in a race with the USA for global leadership[J]. Scientometrics , 2013, 95 (3) : 1031–1050. DOI:10.1007/s11192-012-0846-y
[42] Noyons E C M, Moed H F, Luwel M. Combining mapping and citation analysis for evaluative bibliometric purposes: A bibliometric study[J]. Journal of the American Society for Information Science , 1999, 50 (2) : 115–131. DOI:10.1002/(ISSN)1097-4571
[43] OECD. OECD reviews of innovation policy: China[R]. Paris: OECD, 2007.
[44] Onodera N, Iwasawa M, Midorikawa N, et al. A method for eliminating articles by homonymous authors from the large number of articles retrieved by author search[J]. Journal of the American Society for Information Science and Technology , 2011, 62 (4) : 677–690. DOI:10.1002/asi.v62.4
[45] Opsahl T, Colizza V, Panzarasa P, et al. Prominence and control: The weighted rich-club effect[J]. Physical Review Letters , 2008, 101 (16) : 168702. DOI:10.1103/PhysRevLett.101.168702
[46] Papke L E, Wooldridge J M. Econometric methods for fractional response variables with an application to 401(k) plan participation rates[J]. Journal of Applied Econometrics , 1996, 11 (6) : 619–632. DOI:10.1002/(ISSN)1099-1255
[47] Persson O, Glänzel W, Danell R. Inflationary bibliometric values: The role of scientific collaboration and the need for relative indicators in evaluative studies[J]. Scientometrics , 2004, 60 (3) : 421–432. DOI:10.1023/B:SCIE.0000034384.35498.7d
[48] Phelan T J. A compendium of issues for citation analysis[J]. Scientometrics , 1999, 45 (1) : 117–136. DOI:10.1007/BF02458472
[49] Pichappan P, Sarasvady S. The other side of the coin: The intricacies of author self-citations[J]. Scientometrics , 2002, 54 (2) : 285–290. DOI:10.1023/A:1016070029935
[50] Popper K R. Conjectures and refutations: The growth of scientific knowledge[M]. London: Routledge, 1963 .
[51] Porter A, Youtie J, Shapira P, et al. Refining search terms for nanotechnology[J]. Journal of Nanoparticle Research , 2008, 10 (5) : 715–728. DOI:10.1007/s11051-007-9266-y
[52] Porter A L, Youtie J. Where does nanotechnology belong in the map of science[J]. Nature Nanotechnology , 2009, 4 (9) : 534–536. DOI:10.1038/nnano.2009.207
[53] Porter A L, Rafols I. Is science becoming more interdisciplinary? Measuring and mapping six research fields over time[J]. Scientometrics , 2009, 81 (3) : 719–745. DOI:10.1007/s11192-008-2197-2
[54] Redner S. How popular is your paper? An empirical study of the citation distribution[J]. The European Physical Journal B , 1998, 4 (2) : 131–134. DOI:10.1007/s100510050359
[55] Rehn C, Kronman U. Bibliometric handbook for Karolinska Institutet[EB/OL]. http://ki.se/content/1/c6/01/79/31/bibliometric_handbook_karolinska_institutet_v1.05.pdf,2008.
[56] Ren S L, Rousseau R. International visibility of Chinese scientific journals[J]. Scientometrics , 2002, 53 (3) : 389–405. DOI:10.1023/A:1014877130166
[57] Shapira P, Wang J. Follow the money[J]. Nature , 2010, 468 (7324) : 627–628. DOI:10.1038/468627a
[58] Suttmeier R P, Cao C, Simon D F. China's innovation challenge and the remaking of the Chinese academy of sciences[J]. Innovations: Technology, Governance, Globalization , 2006, 1 (3) : 78–97. DOI:10.1162/itgg.2006.1.3.78
[59] Tang L, Walsh J P. Bibliometric fingerprints: Name disambiguation based on approximate structure equivalence of cognitive maps[J]. Scientometrics , 2010, 84 (3) : 763–784. DOI:10.1007/s11192-010-0196-6
[60] Tang L, Shapira P. China-US scientific collaboration in nanotechnology: Patterns and dynamics[J]. Scientometrics , 2011a, 88 (1) : 1–16. DOI:10.1007/s11192-011-0376-z
[61] Tang L, Shapira P. Regional development and interregional collaboration in the growth of nanotechnology research in China[J]. Scientometrics , 2011b, 86 (2) : 299–315. DOI:10.1007/s11192-010-0274-9
[62] Tang L, Shapira P. Effects of international collaboration and knowledge moderation on China's nanotechnology research impacts[J]. Journal of Technology Management in China , 2012, 7 (1) : 94–110. DOI:10.1108/17468771211207376
[63] Tang L. Does "birds of a feather flock together" matter-Evidence from a longitudinal study on US-China scientific collaboration[J]. Journal of Informetrics , 2013, 7 (2) : 330–344. DOI:10.1016/j.joi.2012.11.010
[64] Tang X. Implement strategy of protecting intellectual property and accelerate enhancing China's independent innovative capability[J]. Bulletin of National Natural Science Foundation of China , 2007, 21 (4) : 210–212.
[65] Taylor M, Perakakis P, Trachana V. The siege of science[J]. Ethics in Science and Environmental Politics , 2008, 8 (1) : 17–40.
[66] Van Raan A F J. The influence of international collaboration on the impact of research results: Some simple mathematical considerations concerning the role of self-citations[J]. Scientometrics , 1998, 42 (3) : 423–428. DOI:10.1007/BF02458380
[67] Van Raan A F J. On growth, ageing, and fractal differentiation of science[J]. Scientometrics , 2000, 47 (2) : 347–362. DOI:10.1023/A:1005647328460
[68] Wang P. Strengthen the redirection role of science funding[J]. Advance in Earth Sciences , 1992, 7 (4) : 11–12.
[69] Youtie J, Shapira P, Porter A L. Nanotechnology publications and citations by leading countries and blocs[J]. Journal of Nanoparticle Research , 2008, 10 (6) : 981–986. DOI:10.1007/s11051-008-9360-9
[70] Zhang H, Patton D, Kenney M. Building global-class universities: Assessing the impact of the 985 Project[J]. Research Policy , 2013, 42 (3) : 765–775. DOI:10.1016/j.respol.2012.10.003
[71] Zhou P, Leydesdorff L. The citation impacts and citation environments of Chinese journals in mathematics[J]. Scientometrics , 2007, 72 (2) : 185–200. DOI:10.1007/s11192-007-1713-0