三角引用关系中文献位置的差异对比研究

2024-02-28 11:37杨文霞邓三鸿胡昊天闫晓慧
信息资源管理学报 2024年1期
关键词:年份跨学科双向

杨文霞 邓三鸿 胡昊天 孔 嘉 闫晓慧

(南京大学信息管理学院,南京,210023)

1 引言

16世纪后期,论文引用制度形成,参考文献成为学术论文的特征[1]。随着国际参考文献格式的逐渐规范,引文分析领域逐渐发展,由此引申出几种常见引用关系,即直接引用关系、耦合关系[2]、共被引关系[3]等。其中,共被引关系是指文献A、B被文献C同时引用,耦合关系是指文献B、C同时引用文献A,直接引用关系是指文献A、B、C之间存在直接引用。Liu等[4]综合了三种引用关系,提出了三角引用的概念,指的是文献A和文献B被文献C引用,同时文献A也被文献B引用的引用关系(见图1)。他们以文献A为源头,得到文献B、C的三角引用,本文称之为正向三角引用;但若同一篇文章在三角引用中分别以文献B和文献C为源头时,分别得到文献A、C和文献A、B的三角引用(见图2),本文称之为“双向三角引用”和“逆向三角引用”,对于这两种三角引用是否存在,若存在,那么三种三角引用数据集的范围是否会有不同,以及三种数据集的数据特征、引用特征是否相同等问题,Liu等则未做研究。

图1 三角引用图示[4]

图2 三角引用结构及其详解

为了补足三角引用的研究,本文首先对相关研究进行了综述,并通过对比之前的研究讨论本文的贡献。其次,讨论三种三角引用关系在实际引用网络中是否存在、存在概率;分析三种三角引用的数据特征和引用特征。最后,对以上研究进行总结与讨论,并给出未来研究展望。对三角引用关系进行分析,有助于在更广泛意义上统一引文网络的基础单元和结构。

2 相关研究

2.1 文献三角引用研究

三角引用指的是A和B被C引用,同时A也被B引用的关系[4]。A、B、C分别被命名为“原始文献”“中介文献”和“追随文献”。其中引用-被引关系包括直接引用关系、耦合关系和共被引关系。结合社会网络分析来看,三角引用属于社会网络中三方组谱系的——三方传递关系[5],映射到引用网络中,可以理解为三方传递引用关系。

Liu等[6]认为,C通过B引用A具有间接引用的特点,并对正向三角引用中的C间接引用A的动机进行了分析。首先,通过B→A和C→A的引文内容相似度,识别出引文相似度较高的C,分析C间接引用A的语境和动机;其次,基于内容标注分析三角引用关系中功能性和情感性的引用动机[7];最后,基于全文本内容分析对三角引用关系中的引用强度、引用位置、引用顺序和引用情感等进行分析[8]。可以看出,Liu虽提出了正向三角引用,并基于此进行了后续研究,但并未涉及本文所提出的双向三角引用和逆向三角引用,为了拓展三角引用的研究,本文将对这三种三角引用进行分析。

2.2 文献间引用关系的研究

文献间引用关系主要包括直接引用关系、耦合关系和共被引关系三种。不少学者采用多种引用关系结合的方式,对文献进行了比较和实证对比研究。例如,Boyack等[9]以生物医学领域为例,比较了直接引用、共被引、耦合和引文上下文混合方法的聚类准确性,结果表明,耦合的效果优于共被引,同时混合方法也进一步优化了文献耦合的结果,而直接引用最不准确。然而,该文献并未将三种引用关系结合分析,而若将三者结合将会发掘出更多的价值[10]。Wang、王菲菲等[11-12]以基因编辑领域为例,从作者角度将共被引、耦合和直接引用这三种引用关系结合得到加权直接引用网络指标,结果发现了更多在领域知识交流与传播中的重要贡献者。而Liu等[4]则从引用网络的角度分析三种引用关系,并将三者结合形成三角引用结构。相比于加权引用指标,三角引用结构更加清晰、简洁,更能从微观角度深入理解引用结构。

2.3 引用特征的研究

一些学者从学科、文献类型、国家、期刊影响因子等方面,分析了引用外部特征。例如,Bornmann等[13]以化学领域为例发现,小领域发表的论文数量较少,相比一般领域,得到的引用机会也较少,论文被引次数更少;Moed等[14]通过研究各学科中论文下载量和被引频次之间的相关性发现,两者相关性在不同学科、期刊、文献类型中存在差异;Pichap-pan等[15]从作者自引的特点和影响等方面综合论述了作者自引的优势与存在的缺点。此外,不同的国家由于科学背景和财政支持不同,发表的论文质量也有高低,例如,美国机构发表的论文通常比其他国家的机构发表的论文得到更多的引用[16];最后,在高影响因子的期刊上发表论文会比在低影响因子的期刊上获得更多的引用[17]。

此外,一些学者还从多个角度分析了文献影响的特征。Gomes等[18]从期刊影响因子、合著者数量和机构地址的数量三个方面得出期刊影响因子越高、合著者数量越多、机构地址数量越多,文章的引用次数越多的研究结论。Tahamtan等[19]通过系统地回顾相关文献指出,影响被引频次的因素包括论文、作者、期刊三个方面的论文质量、参考文献、影响因子、出版形式、作者性别等28个因素,如龚凯乐等[20]从语言、文献类型、期刊、学科等角度对中国期刊论文中的跨语言引用进行多维分析发现,中国学者有五种独特的引文国际化模式。

以上研究虽然包含多种文献的外部引用特征,但是未涉及三角引用,因此在上述研究的基础上,本文将从数据特征、引用时间、跨语言、跨学科、文献类型以及自我引用等方面研究三角引用文献的外部引用特征和内部发展趋势。此外,三角结构的网络基础片段,是整个引文网络中的基本单元,传统的研究或从引文的角度进行分析,或从结构的宏观特征角度进行分析,本文则从中观层面对三角引用进行了更为细致的分析,这对于系统理解引文关系以及引文网络具有重要的价值和意义。

综上所述,三角引用关系是社会网络分析映射到引用网络中的特殊引用结构,为了验证双向三角引用和逆向三角引用的存在,并分析其特征,本文提出以下问题:

1.三种三角引用是否存在?若存在,三种三角引用的特点、引用结构是怎样的?

2.三种三角引用数据集的数据特征、引用时间、跨语言引用、跨学科引用、文献类型、自我引用等是否不同?

3 三角引用相关概念

3.1 三角引用的相关概念

(1)不同文献类型定义

原始文献是同时被中介文献和追随文献引用的文献,中介文献在引用原始文献的同时又被追随文献引用,追随文献则同时引用原始文献和中介文献。为了便于理解,本文在不同类型的三角引用中使用相同的文献种类名称,原始文献、中介文献和追随文献统一表示为A、B和C。A、B、C两两之间存在的引用关系,则被称为三角引用关系。

(2)三角引用关系定义及三种三角引用

正向三角引用是以原始文献为核心文献,基于引证文献的向前检索得到中介文献和追随文献。双向三角引用是以中介文献为核心文献,基于引证文献和参考文献的向前向后相结合得到原始文献和追随文献。逆向三角引用是以追随文献为核心文献,基于参考文献的向后检索得到原始文献和中介文献。

(3)三种三角引用结构

三种三角引用不同的内在引用结构详见图2。虚线表示未真实发生三角引用,实线表示发生了引用,粗线表示发生了真实的三角引用,带底色的A、B、C表示以该类文献为核心文献。

3.2 三种三角引用对比

在正向三角引用中,集合Di表示原始文献的引证文献。由于中介文献和追随文献同时引用了原始文献,因此中介文献和追随文献都需要从原始文献的引证文献集合Di中析出,所以,原始文献的引证文献集合D中引用了其他Di的文献即为追随文献C(D2、D3、D4),被其他Di引用的文献即为中介文献B(D1、D2)。可以看出,中介文献和追随文献以集合形式出现,且两者存在重复文献。A与集合Bi和集合Ci就组成了三角引用关系。

在双向三角引用中,集合Ai表示中介文献的参考文献,集合Ci表示中介文献的引证文献。根据中介文献的参考文献和引证文献是否发生引用关系,得到原始文献和追随文献,所以Ci中引用了Ai的文献即为追随文献C(C2、C4),Ai中被Ci所引用的文献即为原始文献A(A2、A3、A4)。原始文献和追随文献以集合形式出现,且两者并不存在重复文献。集合Ai、B与集合Ci就组成了三角引用关系。

在逆向三角引用中,集合Di表示追随文献的参考文献。原始文献和中介文献同时被追随文献所引用,因此两者都需要从追随文献的参考文献Di中得到,所以追随文献的参考文献集合D中引用了其他Di的文献即为中介文献C(D2、D3、D4),被其他Di引用的文献即为原始文献B(D1、D2)。可以看出,原始文献和中介文献以集合形式出现,且两者存在重复文献。集合Ai、集合Bi与C就组成了三角引用关系。为了区分三种三角引用,本文对三种三角引用关系的核心文献、引用过程、引用状态和引用方向做了对比,见表1。

表1 不同三角引用对比

4 数据与研究方法

4.1 数据的选择与搜集

4.2 研究设计

本文首先获取三种三角引用关系数量以及对应的各类文献的数量;其次,分析三种三角引用关系以及对应的各类文献的存在概率;最后,对比分析三种三角引用的数据特征和引用特征,研究流程详情见图3。

图3 研究流程图

4.2.1 存在概率

确定和比较三种三角引用关系在实际引用网络中的存在与覆盖范围,有助于确保本研究的可行性和价值。因此,对三角引用关系存在概率和三种三角引用中各类文献存在概率进行了定义,见表2。

表2 三种三角引用中各类文献及引用关系存在概率公式

由图2中三种引用结构可知,三角引用关系是从三种文献之间的直接引用关系、耦合关系和共被引关系中析出的。其中正向三角引用的中介文献和追随文献都是从原始文献的引证文献中得到,双向三角引用的原始文献和追随文献分别是从中介文献的参考文献和引证文献得到,逆向三角引用的原始文献和中介文献都是从追随文献的参考文献得到,由此得到三种三角引用中各类文献存在的概率公式。

4.2.2 引用特征分析

(1)引用时间分析

时间在整个科学的发展和进化过程中扮演着重要的角色。通过搜集三种三角引用关系对应文献的出版年份,将发表时间间隔分别计算为年(A←B)、年(B←C)和年(A←C),分析比较三种三角引用关系在引用时间方面的特征。年(A←B)表示中介文献B引用原始文献A的时间间隔,年(A←C)表示追随文献C引用原始文献A的时间间隔,年(B←C)表示追随文献C引用中介文献B的时间间隔。

随着我国经济的发展,人们的生活水平逐渐提高,人们在满足物质需求的同时,对生命质量加强了重视,为了有效的提高护理质量,现阶段我国医院提倡对患者进行预见性护理,本实验中,对研究组妇产科手术患者实行预见性护理,实验结果显示,观察组患者护理满意度为94.29%,高于对照组的82.54%,而并发症发生率却远低于对照组,这就表明预见性护理效果良好,可以有效的改善患者的心理状态,提高护理有效率,减少并发症的发生[12-15]。

(2)跨语言分析

跨语言引用对于很多学者来说存在阅读和理解障碍[21]。通过搜集三种三角引用关系中文献的语言,了解是否存在跨语言的引用情境,并分析三种三角引用中出现跨语言引用的概率。由于核心文献为英语,因此,根据是否为英语分为五种跨语言引用。跨语言分类见表3。

表3 三种三角引用分类情况

(3)跨学科分析

跨学科引用与参考体现了不同学科间知识的输入与输出,能够促进知识的发展与创新[22]。对三种三角引用关系中文献所属研究领域进行分类,了解是否有跨学科倾向,及三种三角引用中出现了跨学科引用的概率。由于核心文献为LIS学科,因此,根据文献所属学科是否为LIS学科,对跨学科引用进行分类,具体见表3。

(4)文献类型分析

科学文献是知识的载体,主要包括期刊论文、学位论文、会议论文、报纸、图书、专利、标准等,不同的科学文献类型在科学交流中起到的作用不同,从文献类型的角度,分析和比较三种三角引用关系中的文献类型,找到各自侧重的文献类型,探讨不同文献类型对引用行为偏好的影响。文献类型分类见表3。

(5)作者自我引用分析

一般认为,如果一篇文献中的某一位或多位作者也存在于另一篇文献的作者中,那么这两篇文献之间就存在作者自我引用。本文定义了5种作者自我引用的类型,见表3。

5 结果与数据分析

从20篇高被引论文的正向三角引用、双向三角引用和逆向三角引用的统计数据中发现,三种三角引用包含的文献总数分别为4765篇、6012篇和876篇,并分别形成了9125条、17438条和1550条三角引用关系。表4—表6和表7分别为三种三角引用的不同文献和引用关系及其出现概率的统计数据和描述性统计。

表4 正向三角引用的统计数据(部分)

表5 双向三角引用的统计数据(部分)

表6 逆向三角引用的统计数据(部分)

表7 三角引用关系中不同文献和引用关系及其出现概率的描述性统计

5.1 三种三角引用数据特征与出现概率分析

从表4—表6可以看出,在正向三角引用中,中介文献数量与追随文献数量相差较大;在双向三角引用中,原始文献数量和追随文献数量相差非常大;相比于前两者,逆向三角引用的原始文献数量和中介文献数量相差较小。表7中三种三角引用中不同文献类型数量之间的平均值之差和出现概率之差也可以侧面证明以上结果。由于正向三角引用是基于引证文献的前向引用,随着时间的推移,中介文献数量与追随文献数量保持动态增加,且由于C←(A、B)形成动态的共被引关系,随着时间的拉长,C集合中新的Ci不断出现。因此相对于中介文献,追随文献的数量在后期会保持增加,图4可以佐证。逆向三角引用是基于参考文献的后向引用,参考文献是静态的,不会随着时间的逆向发展而一直处于增加的状态,因此出现了原始文献数量和中介文献数量相差不大的情况。而双向三角引用是同时基于引证文献和参考文献的前后向结合的三角引用,引证文献为动态,参考文献为静态,中介文献一旦出版就意味着原始文献的数量被固定下来,而追随文献的数量可以一直保持增长,因此,追随文献的数量和原始文献的数量相差悬殊。从所有文献的总和来看,双向三角引用最多,正向三角引用次之,逆向三角引用最少。这正是由于三种三角引用的引用方向不同导致。

图4 正向三角引用的年(A←B)、年(A←C)和年(B←C)分布图

从表4—表7可以看出,三种三角引用都有相关文献和三角引用关系存在,这表明,在实际引用网络中,不但存在正向三角引用[4],也同样存在双向三角引用和逆向三角引用。虽然三种三角引用存在数量有较大差别,但是出现概率存在相似之处。从出现概率的平均值来看,双向三角引用>正向三角引用=逆向三角引用,中值也可以侧面证实。因此,在三角引用关系中较容易存在双向三角引用。三种三角引用数据集存在明显不同的特征,在正向三角引用中,追随文献出现概率的均值要大于中介文献,表明追随文献较中介文献更易存在;在双向三角引用中,追随文献出现的概率大于原始文献,表明追随文献较原始文献更易存在;在逆向三角引用中,中介文献出现的概率要远远大于原始文献,表明中介文献较原始文献更易存在。从时间尺度上看,除核心文献外,三种三角引用中越靠前的文献就越容易存在。

5.2 引用特征分析

5.2.1 引用时间分析

分别对三种三角引用中不同类别文献发表的年份间隔进行计算。图4—图6分别代表正向三角引用、双向三角引用和逆向三角引用各自的文献类别年份间隔分布,其中横轴代表时间间隔,纵轴代表文献数量,不同的颜色代表不同的引用关系。

在图4中,年份间隔出现负值是由于目前存在优先发表制度。年(A←B)和年(B←C)呈典型的正态分布且两者差距较小,年(A←C)与前两者走势差距较大,在0-9年呈增长趋势,9-10年略微下降。在0-6的年份间隔中,年(A←B)和年(B←C)的数量要高于年(A←C),且分别有86.48%、84.58%的文献数量分布在该年份间隔;而在6—10的年份间隔中,年(A←C)的数量则要高于前两者,且有77.19%的文献数量分布在较大的年份间隔。在较小的年份间隔区间,年(A←B)和年(B←C)的数量增加较快,且分别在4年和3年的间隔年达到峰值,而(A←C)的数量增加则较慢;随着时间间隔变大,前两者都在下降,而年(A←C)则是继续增加且增加速度较快,然后在8年的年份间隔达到峰值后下降。因此,年(A←B)和年(B←C)在年份较小的间隔内分布较多,年(A←C)在年份较大的间隔内分布较多。

从图5中可以看出,年(A←C)呈正态分布,年(A←B)也大致呈正态分布,其年份间隔较长则是基于参考文献的角度向后引用。而年(B←C)则一直增长到8的年份间隔然后下降,其年份间隔较短是基于施引文献的角度向前引用,由于来源文献为2011年,因此截至2021年,最长时间为11年。就现有数据来看,年(B←C)虽然在8的年份间隔达到最大值,但有一直增长的可能性,而年(A←B)在6的年份间隔达到最大值,却没有增长潜力,意味着追随文献C对中介文献B的引用可持续性更强,这说明向前引用要比向后引用具有更强的发展性。虽然双向三角引用的三种引用关系与正向三角引用并不完全相同,但仍然是年(A←B)和年(B←C)先达到峰值并在年份较小的间隔内分布较多,年(A←C)后达到峰值,且在年份较大的间隔内分布较多。年(A←B)在年份间隔较大时分布并不连续,且在年份较大的间隔时有跳跃性增加,如30年和38年的年份间隔。

图5 双向三角引用的年(A←B)、年(A←C)和年(B←C)分布图

在图6中,三种三角引用的年份间隔基本呈正态分布,且年(A←B)和年(B←C)年份间隔的发展趋势基本一致,但是前8年的间隔都是年(B←C)要高于年(A←B),8—13年的间隔出现反复,之后则年(A←B)高于年(B←C)。与前两种三角引用相比,相似的是,年(A←B)和年(B←C)先达到峰值,年(A←C)后达到峰值;年(B←C)和年(A←B)在年份较小的间隔内分布较多,年(A←C)在年份较大的间隔内分布较多;不同的是,在年份间隔较大时,三种引用关系分布都不连续,尤其是年(B←C)。前两种三角引用的年(A←C)分布走势都较为和缓平滑,而逆向三角引用的年(A←C)则显示出明显的跳跃式走势。

图6 逆向三角引用的年(A←B)、年(A←C)和年(B←C)分布图

总体来看,三种三角引用的文献类别年份间隔分布完全不同,正向三角引用的年份间隔较短,为[-2,10];双向三角引用和逆向三角引用的年份间隔则较长,分别为[0,66]和[0,56]。从数据量角度来看,双向三角引用的引用关系数量最多,其次是正向三角引用,逆向三角引用的引用关系数量最少。综合来看,无论在哪种三角引用中,年份间隔较短时年(A←B)和年(B←C)的文献数量较多,年(A←C)的文献数量较少,随着年份间隔的拉长,年(A←B)和年(B←C)的文献数量变少,年(A←C)的文献数量则在增加。这意味着年份间隔较短时,年(A←B)和年(B←C)的直接引用关系反应较快,年(A←C)的间接引用关系反应较慢;随着年份间隔拉长,要经过两个直接引用关系才能实现追随文献引用原始文献,因此,在文献数量上体现为年(A←C)较为滞后。知识需要经过A←B的内化和B←C的外显,才能实现A←C的知识外化。因为一篇论文被引用需要经过同行评议、出版、阅读、分析理解、引用等过程。经过时间的洗礼,有价值的文献被逐渐筛选出来,得到更多追随文献的引用,这也是((A、B)←C)共被引关系的动态性的表现。该原因较为容易理解,正向三角引用对其他两种三角引用的原理分别是双向和逆向的知识扩散,正是由于正向知识扩散的存在,才使得双向和逆向知识扩散和溯源成为可能。

5.2.2 跨语言分析

分别对三种三角引用关系中A、B、C所属语言进行分类统计,见表8。在本研究中,主要语言是英语。

表8 三种三角引用的语言差异

从语言类型来看,全英语引用的类型占绝对优势,尤其是在逆向三角引用中,说明在A、B、C都是英语的情况下,更易出现三角引用;在耦合英语引用中,正向三角引用和双向三角引用较多,而逆向三角引用不存在该类型;连续英语引用和共被引英语引用则分别少量出现在正向三角引用和双向三角引用中;无相同语言引用则完全没有出现在任何类型的三角引用中,意味着三种文献语言都不同的三角引用几乎不可能出现。

通过阅读耦合英语引用类型中的文献发现,在正向三角引用和双向三角引用中,C引用B的内容和B引用A的内容存在较高的相似度。意味着在引用过程中,当A和B同时为英语,而C为其他语言时,文献C的作者是通过B来引用A的。原因是文献C的作者可能受到语言阅读和理解障碍,因此更倾向于参考或复制B的参考文献,从而间接引用A。而逆向三角引用中没有出现该类型,是由于逆向三角引用是以C为核心文献,向后追溯相关研究内容,由于受到语言障碍,更倾向于引用同种语言。

此外,本文还统计了正向和逆向三角引用中涉及的其他九种语言,其中西班牙语最多,在49条三角引用关系中出现,最少的是匈牙利语,只有1条,说明和其他语言相比,西班牙语的追随文献更倾向于引用原始文献A和中介文献B。以上结果意味着语言差异也是影响三角引用出现的重要因素。

5.2.3 跨学科分析

分别对三种三角引用关系中A、B、C所属学科进行分类统计,见表9。

表9 三种三角引用的跨学科引用分布

在表9中,正向、双向和逆向三角引用关系中跨学科引用分别为7131条、17571条和1792条,分别占三种三角引用关系的78.15%、78.39%和74.32%,其余则为同学科引用。可以看出,相比于同学科引用,跨学科引用在引用关系中占大部分,且更倾向于出现在双向三角引用中,其次是正向三角引用,最后是逆向三角引用。耦合跨学科引用更倾向于出现在正向和双向三角引用中,在逆向三角引用中共被引跨学科引用最多;连续跨学科引用在双向和逆向三角引用中的数量都是最少的,正向三角引用中共被引跨学科引用则最少;全部跨学科引用在三种三角引用中都出现较多。

此外,本文还统计了正向三角引用、双向三角引用和逆向三角引用中所涉及的学科,研究发现,三种三角引用的LIS跨学科引用分别包括113种、112种和38种学科,涉及数量较多的跨学科包括computer science、business &economics、engineering、psychology、medical informatics、health care sciences &services等。这一结果与Huang等[23]和Chang等[24]的LIS跨学科研究结果基本一致。

5.2.4 文献类型分析

分别对三种三角引用关系中A、B、C的文献类型进行了分类统计,计算不同文献组合的数量和占比。表10显示了三种三角引用关系中各类文献类型组合中的排名前10的组合,图7为三种三角引用中文献类型组合的概括对比。

表10 三种三角引用中各类文献类型组合分布

图7 三种三角引用中文献类型组合的概括对比

综合来看,在三种三角引用中,A、B、C的文献类型主要是article、review,其次是editorial material、proceedings paper,其他文献类型包括letter、software review、book review、note、news item和discussion。一方面,article、review、editorial material和proceedings paper在三种三角引用中占有绝对优势,其组成的A-B-C文献类型组合在三种三角引用中都在99%以上;另一方面,article、review、editorial material和proceedings paper类文献在人文社科领域承担着记录和传播主要研究成果的重任,在知识交流中扮演着重要角色,因此在引用网络中也具有绝对的数量优势。

在三种三角引用的A-B-C文献类型组合中,数量最多的是article-article-article,分别占49.61%、41.08%和43.09%,其次分别是review-article-article、article-review-article、article-article-review,各自占比17.14%、21.71%和24.58%。在图7中,A-B-C文献类型组合最多的仍然是相同文献类型,如article-article-article和review-review-review,最少的则是A-B-C属于三种不同的文献类型。可以看出,无论是哪种三角引用,A-B-C文献类型相同的组合数量都是最多的,A-B-C文献类型都不同的组合数量都是最少的,这意味着,三角引用更倾向于在前者中出现,更少在后者中出现。但是三种三角引用也存在不同之处,对于正向三角引用来说,共被引文献类型相同的组合较多,如review-article-article,review-proceedings paper-proceedings paper等;对于双向三角引用来说,连续文献类型相同的组合较多,如article-review-article,review-article-review等;对于逆向三角引用来说,耦合文献类型相同的组合则较多,review-review-article,editorial material-editorial material-article等。

5.2.5 自我引用分析

分别对三种三角引用关系中A、B、C之间自我引用进行分类统计,分析结果见图8和图9—图11。在图8中,横坐标为文献的序号,纵坐标为作者自引在引用关系中的百分比;在图9—图11中,横坐标为文献的序号,纵坐标为不同种类的作者自引数量。

图8 三种三角引用的作者自我引用占比

图9 正向三角引用的自我引用分布

图10 双向三角引用的自我引用分布

图11 逆向三角引用的自我引用分布

从图8可以看出,三种折线的走势具有一致性,意味着同一文献在不同三角引用中的作者自引占比情况具有相似性,其中在三种三角引用中占比都较低的文献为6—8号、12号和15号,而16号文献则占比都比较高。其余文献虽然在三种三角引用中占比有高有低,但基本相差不大,而10号文献比较特殊,在正向和双向三角引用中占比都较低,但在逆向三角引用中却占比最高,且是所有占比最高的。经查证发现,10号文献的逆向三角引用关系只有1条,且为共被引作者自引,因此出现了这种极端占比。

在图9—图11中,正向、双向和逆向三角引用关系中作者自引分别为2591条、3887条和382条,分别占三种三角引用关系的28.39%、22.29%和24.64%。可以看出,相比于无作者自引,包含作者自引的引用关系占比较少,表示大部分文献都是非自引,自引在三角引用中出现得较少,意味着有很多其他领域作者从事相关领域的研究。虽然作者自引占比较少,但是三种三角引用也存在区别,最常出现作者自引的是正向三角引用,其次是逆向三角引用,最后是双向三角引用。

从图9—图11的纵坐标可以看出,双向三角引用中作者自引出现的次数最多,其次是正向三角引用,逆向三角引用则最少,这和上文的作者自引总量具有一致性。正向三角引用和双向三角引用中数量最多的类型是耦合作者自引,而逆向三角引用中数量最多的则是共被引作者自引,连续作者自引在三角引用中的数量都是最少的,尤其在双向三角引用中最少。根据作者自引类型的定义可知,耦合作者自引和共被引作者自引在引用关系中属于直接引用,而连续作者自引属于间接引用,因此,在正向三角引用中,向前引用时作者自引较多;在双向和逆向三角引用中,向后引用时作者自引较多;而在三种三角引用中,连续作者自引都较少出现。这表示三角引用中作者的自我引用更倾向于直接引用,如B直接引用A、C直接引用B,而间接引用较少,如C引用A。这意味着文献A和B之间、B和C之间大多是相似的、系统的或连续的研究,他们倾向于同时引用之前完整和相关的研究成果;而文献A和C之间出现的作者自引较少,意味着文献A和C之间产生自引较为困难,可能是由于文献A和C之间的研究内容出现了变化,或者对之前的研究进行了创新或改进。

此外,全作者引用在三种三角引用的作者自引中出现的概率分别为14.70%、8.41%和13.35%,图9—图11的全作者引用类型与该数据一致,可以看出,全作者引用在正向和逆向三角引用中出现较多,而在双向三角引用中出现非常少。当然,在三种三角引用中也存在一些全作者引用数量都较高的文献,如序号为11的文献,意味着这些文献的A、B、C之间形成了系统性的研究,其传承性和完整性较强。除了以上相同的文献序号,三种三角引用之间也相互交叉一些文献序号,如正向三角引用和双向三角引用的文献3和9,正向三角引用和逆向三角引用中的文献2,双向三角引用和逆向三角引用中文献16和20。三种三角引用中的全作者引用数量较高的文献序号既有相同又存在不同,表明三种三角引用既存在一些相似性又保持着各自的独特性。

6 结论与讨论

本文从同一篇文章在三角引用中不同位置的角度提出了正向三角引用、双向三角引用和逆向三角引用,并对三种引用的特点和引用结构进行了分析。本文从高被引论文的角度出发,获得了三种引用的数据集,发现三种三角引用关系都存在于实际引用网络中,且双向三角引用中最易出现三角引用关系。从文献数量来看,双向三角引用最多,正向三角引用次之,逆向三角引用最少。

从引用特征来看,在引用时间上,三种三角引用中年份间隔较短时,年(A←B)和年(B←C)的数量较多,年(A←C)的数量较少,随着时间间隔的拉长,则相反;其次,在跨语言引用上,同种语言更易出现三角引用,跨语言引用较少产生,这是由于跨语言引用时存在语言障碍;在跨学科引用上,跨学科引用在三种三角引用中占大部分,且更倾向于出现在双向三角引用中,其次是正向三角引用,最后是逆向三角引用;对于文献类型,三种三角引用的A、B、C文献类型主要是article、review,A-B-C文献类型组合中,数量最多的是相同文献类型,数量最少的是不同文献类型;作者自引在三种三角引用中出现的都较少,且都更倾向于出现在耦合作者自引和共被引作者自引中,较少出现在连续作者自引和全作者引用中。

三种三角引用既有相同之处,也存在不同之处。在文献类型和作者自引中,三种三角引用表现一致;在出现概率、文献数量特征,以及引用时间、跨语言引用和跨学科引用上存在区别。不同的引用方向、引用结构都会导致三种三角引用存在差别。

在实际应用方面,三角引用结构结合文本相似度与耦合引用强度分析漏引、非相关引用的不合理引用行为,有助于科学合理地评价文章的影响力。以双向三角引用为例,以文献B为核心文献得到文献A、C,对文献A、C两两配对得到三角引用关系的数据,并删除发生过三角引用关系的数据,之后计算文章的相似度和耦合引用强度,其中耦合引用强度是指文献A和C共同引用的文章数量。若相似度高且耦合引用强度也高,表明文献存在漏引情况。以双向三角引用为例,对三角引用关系中文献A、C的相似度和耦合引用强度进行计算,若相似度低且耦合引用强度也低,表明存在非相关引用。以上两种不合理引用都可结合三角引用结构,从文章内容和共同参考文献数量两方面共同分析,从而合理进行科学计量评价。

综上所述,本研究对三角引用进行分类,证明了三种三角引用实际存在于引用网络中,并对三种三角引用数据集的数据特征和引用特征进行了分析。但是也存在不足,如作为一项探索性研究,数据仅限于LIS学科的高被引论文,数据量有限,不一定适应于其他学科或引用量较少的论文;数据样本基本为英文,不能挖掘论文的语言特征是否对三角引用有影响;在时间间隔变化过程中各个引用关系的数据表现、引用特征、网络特征、知识流动特征的变化都有待研究。因此,为了解决以上问题,有必要对更大规模的数据进行实证研究。

7 未来研究

三角引用是文献计量学中一种特殊的引用关系和实际存在的现象,具有较高的研究价值和意义。为了从更深层次了解三角引用的引用机制和知识流动特征,今后将以多个学科的文献数据为研究对象,并从三类潜在三角引用的角度对三种三角引用进行进一步分析和深入研究,即,从文本相似度和耦合引用强度两方面确定漏引和非相关引用是否存在;从语言差异、文献类型、学科差异、期刊影响力、发表时间差异、文献影响力、作者影响力等方面研究三角引用中漏引与非相关引用的影响因素;从引用强度、引用位置、引用动机、引用情感、作者自引等方面分析非相关引用的特点,从而规避漏引与非相关引用的不合理引用行为。

猜你喜欢
年份跨学科双向
双向度的成长与自我实现
跨学科教学在高中生物课堂教学中的应用实践
初中历史跨学科主题学习活动的实践与思考
特殊的一年
应用型高校推进跨学科人才培养的路径探索
商标跨类保护的跨学科解释
什么是闰年?
一样的年份
一种软开关的交错并联Buck/Boost双向DC/DC变换器
一种工作频率可变的双向DC-DC变换器