SCI收录期刊的影响因子与2年自被引率的历年变化与分析
——兼谈加菲尔德期刊自引率论断的时效性

2019-07-29 06:25金铁成
中国科技期刊研究 2019年7期
关键词:中位数平均值年度

■金铁成

河南工业大学学报编辑部,河南省郑州市高新技术开发区莲花街100号 450001

在全球性SCI 现象和影响因子(Impact Factor,IF)崇拜的背景下,期刊的影响因子受到了学术期刊编辑和科研人员的高度关注[1]。IF已成为学术期刊吸引高质量稿件的重要条件和论文作者选择投稿期刊的参考依据。因此,许多学术期刊采取了各种正当的手段,如组约高质量的论文、缩短论文出版周期、扩大期刊传播渠道等,或者不正当的手段,如期刊过度自引、同盟引用、有偿引用等,以期达到提高期刊IF的目的[2]。采用不正当手段提高期刊IF是操纵IF的行为,其中比较常见的为期刊过度自引包括期刊编辑强迫与诱导作者进行期刊自引和作者为了讨好所投期刊进行“献媚”自引[3]。

检测学术期刊自引程度的指标有自引证率(Self-Citing Rate)[4-5]、自被引率(Self-Cited Rate,SCR)[6-8]、参与影响因子计算的自引率(Self-Citation Rate Involved in the Calculation of Impact Factors,SCRIF)[9]、2年自被引率(Two-Year Self-Cited Rate,SCR2)[10]、影响因子构成中的自引率(Self-Citation Rate for Impact Factor)[11]、影响因子相关自被引率(Self-Cited Rate Correlated with Impact Factor)[12-13]、% Self Cites in JIF Numerator[14]、the Impact-Relevant Self-Citation Rate[15]、近3年时间窗口他引率[16]等。其中,SCRIF、SCR2、影响因子构成中的自引率、影响因子相关自被引率、% Self Cites in JIF Numerator、the Impact-Relevant Self-Citation Rate六者的含义相同,均指在此统计当年内某期刊前2年发表的论文的自被引频次除以它们的总被引频次。鉴于它们的研究对象均是前2年发表的论文,引证时间窗口均为2年,本研究将其统称为SCR2。

自《期刊引证报告》(JournalCitationReports,JCR)问世以来,特别是1997年JCR网络版发布以来,期刊编辑人员与文献情报人员利用JCR提供的期刊自引数据,对SCI收录期刊的期刊IF与期刊自引等相关问题进行了大量研究。

从已有文献采用的检测指标来看,使用最多的指标为SCR,SCR2及其衍生指标(RD[11]、K[12]和IFBSCP[17])也受到了较大的关注。尽管SCR指标的被使用频次最高,但它并不是最理想的期刊操纵自引的检测指标。金铁成[10]将SCR与SCR2作为评价指标,检测了2014年119种食品科技SCI收录期刊的自引情况,认为SCR2的引证时间窗口、研究对象与期刊IF相同,而且与SCR相比,SCR2的离散程度更大、检测反应速度更快,更适合作为检测期刊过度自引的定量指标。

从已有研究选取的样本数量来看,这些研究大多以某些学科、某些国家或某些典型的SCI收录期刊为研究对象,研究的样本量较小,鲜有研究以全部SCI收录期刊为研究对象进行大样本分析[9,11,18]。以全部SCI收录期刊为研究对象进行大样本研究,可以避免只见局部、不见整体的弊端,得到的各种评价指标的数值也更具有普遍性。

从已有文献采用的研究时长来看,绝大多数研究以某一年份的SCI收录期刊为研究对象,很少有研究以连续几年、十几年甚至几十年的SCI收录期刊为样本进行指标年度对比或者变化趋势研究。刘昌来等[8]对我国2012—2014年出版的63个学科的近4000种期刊的SCR进行了研究,结果显示SCR在不同统计年份之间的差异具有统计学意义。尽管该研究的对象不是SCI收录期刊,但是其研究结果具有启发意义。刘雪立等[9,11]分别对2009年的7347种SCIE收录期刊和2015年的8778种SCI收录期刊的SCR与SCR2等计量指标进行分析,结果显示不同统计年份的SCR2、SCR的平均值差异具有统计学意义。

从已有文献采用的指标数值来看,绝大多数研究以SCR≤0.2作为期刊合理自引的衡量标准。这一衡量标准来自美国文献计量学专家加菲尔德于20世纪80年代提出的期刊自引率论断——专业期刊的自引率应在20%左右[19-20]。30多年来,科技论文的数量、科技期刊的种类、科技文献的传播速度等都发生了翻天覆地的变化,这种变化也对SCI收录期刊的引证指标产生了影响。SCI收录期刊的IF逐年提高,特别是最高IF逐年被刷新,这是大家有目共睹的事情。然而,在期刊IF升高的同时,期刊的SCR与SCR2反而下降。从文献[9,11]的研究数据可知,2015年SCR的平均值(0.093)比2009年(0.111)下降了16.2%,2015年SCR2的平均值(0.131)比2009年(0.150)下降了12.7%。期刊的整体自引水平也下降了,SCR≤0.2的衡量标准值是否应随之调整?也就是说,加菲尔德的期刊自引率论断“专业期刊的自引率应在20%左右”是否随着时代的发展而过时?这些问题值得深思。

鉴于以上分析,笔者拟以1997—2016年SCI收录期刊为研究对象,考察SCI收录期刊的IF与SCR2的历年变化情况,从宏观上揭示SCI收录期刊IF与SCR2在20年间的变化趋势,并分析这一趋势产生的原因,以期对期刊编辑人员与文献情报人员有所启示。

1 数据来源与方法

1.1 数据获取与处理

登录InCites Journal Citation Reports 数据库,分年度下载1997—2016年SCI收录期刊的年度JCR数据,导出文件格式为CSV,指标包括JCR提供的全部指标,如期刊全称、ISSN、IF、他引影响因子(Impact Factor without Journal Self-Cites,IFW)等。

用Excel软件打开下载的CSV文件,并转换为Excel格式文件。剔除IF为0和没有给出IF的期刊,得到每年的期刊数量。

1.2 指标选取与计算

选取SCR2为评价期刊自引程度的指标。选取SCR2的理由:(1)与SCR相比,SCR2能真实地反映期刊自引对IF的贡献,它具有识别速度快、离散程度大等特点;(2)SCR与SCR2的衍生指标还不成熟,有待完善;(3)对于其他指标如SCR、近3年时间窗口他引率等,进行大样本数据采集相当困难,既费时又费力,而SCR2可以通过间接计算获取,大样本数据获取十分方便。

本研究中SCR2的含义为:SCR2=2年自引频次(Self Cites to Years Used in Impact Factor Calculation)/2年被引频次(Cites to Years Used in Impact Factor Calculation)。本研究中涉及的SCR的含义为:SCR=自引频次(Self Cites)/总被引频次(Total Cites)。

本研究中SCR2采用间接方法计算得到,SCR2=1-(IFW/IF),每种期刊的SCR2由Excel软件直接计算得到。

1.3 统计学处理

采用SPSS 23软件进行数据描述与处理;采用Kolmogorov-Smirnov(K-S)检验数据分布的正态性(α=0.05),采用Spearman进行相关性分析。

2 结果

2.1 IF、SCR2及其相关系数的年度变化

1997—2016年SCI收录期刊的IF、SCR2及其相关系数的年度变化如表1所示。

表1 IF、SCR2及其相关系数的年度变化

注:**表示在0.01级别(双尾),相关性显著。

由表1可知:SCI收录期刊的数量逐年递增, 1997年为4892种,2016年为8848种,20年间期刊数量增加了80.9%;各年度IF的最大值整体呈上升趋势,由1997年的40.782上升到2016年的187.040,20年间提高了358.6%; IF中位数的变化趋势与IF最大值的变化趋势相同, 1997年的IF中位数为0.708, 2016年的为1.658,20年间IF中位数的平均值为1.130;SCR2中位数整体呈下降趋势,1997年的SCR2中位数为0.141,2016年的为0.087,20年间SCR2中位数的平均值为0.113;各年度的IF与SCR2的相关系数基本保持在-0.276左右。

图1 IF平均值与IF中位数的年度变化

2.2 IF平均值与IF中位数的年度变化

图1为IF平均值与IF中位数的年度变化的折线图,直观地呈现了IF平均值与IF中位数的年度变化趋势。经SPSS软件的K-S检验,各年度的IF呈非正态分布,各年度的IF平均值均大于中位数。从图1可以看出,1997—2016年IF平均值与IF中位数变化趋势一致,分为两个阶段:从1997—2008年两个指标均呈上升趋势;2008年后,先缓慢下降,然后缓慢上升,上升斜率比前一阶段小。1997年、2016年的IF平均值分别为1.278、2.433,IF中位数分别为0.708、1.658,IF平均值与IF中位数20年间分别上升了90.4%和134.2%。

2.3 SCR2平均值与SCR2中位数的年度变化

图2为SCR2平均值与SCR2中位数的年度变化的折线图,经SPSS软件的K-S检验,各年度的SCR2也呈非正态分布,各年度的SCR2平均值均大于中位数。

图2 SCR2平均值与SCR2中位数的年度变化

从图2可以看出,SCR2平均值与SCR2中位数整体上也是呈逐年下降趋势,其中2008年仍然是一个特殊的年份,2008年之前,基本呈下降趋势,2008—2011年有一个小幅度的反弹,然后又呈逐年下降趋势。1997年、2016年的SCR2平均值分别为0.179、0.120,SCR2中位数分别为0.141、0.087,SCR2平均值与SCR2中位数20年间分别下降了33.0%和38.3%。

刘雪立等[9,11]的研究结果显示2009年与2015年的SCI收录期刊的SCR2平均值为0.150、0.131,本研究的结果分别为0.149、0.131,两者基本一致。

2.4 具有较高SCR2的期刊数量占比的年度变化

为了解各年度具有较高SCR2的期刊数量占比,对SCR2≥0.2、SCR2≥0.3、SCR2≥0.4、SCR2≥0.5的期刊数量占比进行了统计,各年度的变化情况见图3。

由图3可知,1997—2016年SCI收录期刊的SCR2≥0.2、SCR2≥0.3、SCR2≥0.4、SCR2≥0.5的期刊数量占比整体上均呈下降趋势,4条曲线的变化趋势基本相同。2008年依然是特殊年份,2008年前,各个水平的期刊数量占比均呈下降趋势,2008年后,各个水平的期刊数量占比均先小幅升高,然后逐年下降。SCR2≥0.2、SCR2≥0.3、SCR2≥0.4、SCR2≥0.5的期刊数量占比从1997年的0.343、0.178、0.093、0.050分别下降到2016年的0.176、0.073、0.031、0.015,分别下降了48.6%、59.1%、66.5%、70.4%。由此可见,SCR2越高,期刊数量占比下降幅度越大,充分说明期刊自引对IF的贡献越来越小。

图3 不同SCR2的期刊数量占比的年度变化

3 讨论

3.1 高IF期刊的IF不依赖于期刊自引

1997—2016年,各年度SCI收录期刊的IF与SCR2呈显著负相关,相关系数基本保持在-0.276左右。2002年的JCR期刊自引分析显示了同样的研究结果,即IF与SCR呈负相关(r=-0.192)[18]。

从整体来看,IF较高的期刊反而具有较低的SCR2和SCR。这表明高IF期刊的IF并不是通过提高期刊的SCR2和SCR来实现的,即IF较高的期刊不是通过操纵期刊自引来达到提高IF的目的,而是采取其他有效措施来吸引高质量的论文,提高期刊的学术质量,从而提高期刊IF。

3.2 具有较高SCR2的期刊数量占比下降的主要原因

(1) 期刊的数量增加。随着新兴学科与交叉学科的发展,大量科技期刊得以创办,SCI收录的期刊数量也逐年增加。1997年JCR收录的期刊只有4962种(原始数据),而2016年已增加至8879种(原始数据),20年间期刊数量增长了78.9%。由此可见,从1997—2016年作者可供引用的期刊数量越来越多,可供引用的论文数量也越来越多。这势必导致期刊他引量和自引量都逐年增加,由于期刊他引量增加的速度大于期刊自引量增加的速度,因而就出现了前文中SCR2逐年下降的现象。

(2) 监管与警示教育。SCI数据库一直非常关注收录期刊的自引情况,从期刊遴选开始就对期刊的自引进行审查,在每年发布的JCR中,专设他引影响因子用来显示期刊自引对IF的影响。此外,还提供了详细的Citing Journal Data和Cited Journal Data来反映期刊的引用与被引用情况。这些数据的公开不仅有利于期刊了解自身的自引情况,而且有利于同类期刊相互监督。更重要的是,从2007年版的JCR开始,SCI数据库每年还发布被镇压期刊名单(Title Suppressions),对少数高自引、引文堆积(Citation Stacking)的期刊予以镇压,暂停公布其当年的IF[21-22]。这一举措无疑对包括期刊过度自引在内的操纵引文的行为起到了惩戒与警示作用。

3.3 加菲尔德的期刊自引率论断受到挑战

1997—2016年SCI收录期刊的SCR2中位数与平均值整体均呈逐年下降的趋势,这一趋势显示SCI收录期刊的自引水平整体下降。由图2可知,2015年的SCR2平均值(0.131)比2009年的平均值(0.149)下降了12.1%。这一结论与文献[9,11]所反映出的SCI收录期刊的SCR的下降趋势一致。

如果以加菲尔德的期刊自引率论断“专业期刊的自引率应在20%左右”为标准,即SCR≤0.2作为衡量标准,2002年SCI收录期刊的SCR≤0.2的期刊数量占比为82.0%[18],2009年的为85.6%[9],2015年的为89.2%[11];同样,如果以SCR2≤0.2作为衡量标准,2002年SCI收录期刊的SCR2≤0.2的期刊数量占比为71.6%,2009年的为76.0%,2015年的为79.1%。因此,随着时间的推移,采用同一指标的同一标准值的期刊数量占比越来越大。针对SCI收录期刊的自引水平整体下降这一趋势,笔者认为,目前仍然采用SCR≤0.2这一标准,要求有点低,可以将SCR的标准值调整为0.15或者其他数值。

2016年7月18日,汤森路透(现为科睿唯安)更新的期刊遴选流程[23]显示:“Among all journals listed in the 2014 JCR Science Edition, for example, 85% have self-citation rates of 15% or less.”而2006年的期刊遴选流程[24]显示:“Eighty percent of all journals listed in the JCR Science Edition have self-citation rates of less than 20%.”两处使用的SCR一个是20%(2006年),另一个是15%(2016年),如果是刻意区分的话,则意味着SCR的标准值有变化。这意味着美国文献计量学专家加菲尔德在20世纪80年代所提出的期刊自引率论断“专业期刊的自引率应在20%左右”的标准已被撼动。

4 结语

SCI收录期刊中高IF期刊的IF主要不是依靠期刊自引来实现的。因此,学术期刊编辑应遵循学术出版道德,不强迫、不引诱投稿作者进行期刊自引,把精力集中在期刊的质量建设和学术影响上。那些通过操纵引用来提高影响因子的掩耳盗铃行为,是经不起各种评价指标检验的,迟早是会被识破和曝光的。

随着时间的推移,无论是SCI收录期刊的2年自被引率还是自被引率,均呈逐年下降的趋势。对于不同年份的SCI收录期刊,用一个固定不变的标准值来衡量期刊的自引程度显然是不合理的。因此,检测期刊自引程度的自被引率与2年自被引率的标准值应随着时间的推移作适当的修正。

猜你喜欢
中位数平均值年度
平均值的一组新不等式
年度新锐之星
年度创意之星
年度
中位数计算公式及数学性质的新认识
变力做功时运用F=F1+F2/2的条件
中位数教学设计
平面图形中构造调和平均值几例
2007/2008年度桑蚕干茧质量分析报告
2006-2007年度最佳商业模式