科学中的“睡美人”与“昙花一现”现象评述

2016-12-29 19:27李江

大学图书馆学报 2016年3期

李江

摘要 “睡美人”现象是科学论文中存在的一种特殊现象，指论文刚发表时几乎被忽视，很少被引用，但若干年之后，突然被大量引用。“昙花一现”现象与“睡美人”现象正好相反，指论文刚发表时立即引起关注，但持续时间很短，很快被人遗忘。学术界对被引次数的关注主要集中在“高被引”论文。研究“睡美人”与“昙花一现”现象的意义在于将学术界的注意力吸引到“低被引”或“零被引”论文上。论文在评述这两种引文现象的相关研究之后，解释了他们在科研管理中的意义，并探讨了进一步研究的方向。

关键词睡美人昙花一现迟到的认可科学规律定量标准

1.“睡美人”现象

科学论文中存在一种现象，即论文刚发表时几乎被忽视，无人提及，但若干年之后，突然被大量关注，得到广泛认可。例如，奥地利遗传学家孟德尔（Mendel）的1866年发表的论文《植物杂交实验》，在发表之后的30多年时间里，几乎无人问津。直到1900年，他的发现被欧洲三位不同国籍的植物学家在各自的杂交试验中分别予以验证后，这篇埋没了长达34年之久的经典文献才被重新重视。

在1960年代，这种现象被称为“过早的科学发现（Premature Discovery）”或“未被认可的科学发现（Resisted Discovery）”。在这一阶段，学者们基于广为人知的案例，分析了科学发现“过早”的原因。加菲尔德（Garfield）认为可以从被引次数的角度判断一篇论文是否“过早”或“不被认可”。

自1970年代开始，人们称这种现象为“迟到的认可（Delayed Recognition）”。同行认可是科学领域对科学贡献的最好奖励。这一术语更具概括性，囊括了“过早”与“不被认可”的特征。加菲尔德根据学科的发展特征解释了“迟到的认可”产生的原因。这种定性的案例分析可以让读者深入了解“迟到的认可”，但因为缺乏规范的语言表述，使得同类研究难以广泛开展起来。加菲尔德自1980年代后期开始借助定量的方法寻找“迟到的认可”，所设定的定量分析标准便是“睡美人”的雏形。

自21世纪初开始，这种现象被称为“睡美人（Sleeping Beauty）”。在这三个不同发展阶段中，现象的本质并未发生变化，变化的只是称谓。所以上述称谓之间并没有替代关系。基于“睡美人”的定量标准，学者们在不同的学科中寻找“睡美人”。进而，也有学者在文献中找到童话故事里的“王子”。在20世纪的100年里获诺贝尔科学奖的论文中，笔者发现四个“睡美人”的特例——“公主”在沉睡之前曾活跃，被“纺锤”刺破手指后进入沉睡状态，再被“王子”亲吻后“苏醒”。因此，将这类睡美人定义为“全要素睡美人（All Element Sleeping Beauty）”，即在其被引用的历史中，“公主”、“王子”、“纺锤”都曾出现。

爱因斯坦（Einstein）等人在1935年发表的一篇关于量子力学的论文的被引曲线，乃典型的睡美人曲线。文章在发表30年后才逐渐被大量关注，在发表75年后才迎来被引次数的峰值（图1）。

2.“昙花一现”现象

2005年，与“睡美人”现象相反的另一种引文现象受到关注，即论文发表之后迅速被认可，但又很快被遗忘。这种论文被称为“流行作品（Hits）”，“流星（Shooting Star）”，也被称为“昙花一现（Flashes in the Pan）”。笔者认为，用“昙花一现”来描述这种现象更确切，因此下文中对这种引文现象的介绍均用“昙花一现”。1969年诺贝尔生理医学奖获得者赫尔希（Hershey，A.D.）发表的一篇“昙花一现”的论文如图2所示。该论文发表于1953年，发表当年达到引文曲线的峰值，两年内被引用12次，自第3年之后累计被引用2次。作者虽获得诺贝尔奖，但也未能阻止该论文被人们迅速遗忘的命运。

在为数不多的关于“昙花一现”论文的相关研究中，学者们以不同学科的论文为对象，比较了“昙花一现”和“睡美人”现象。以人口统计学论文为对象的研究发现：“昙花一现”和“睡美人”现象更可能出现在学科内的一流期刊中。与学者个人声誉、“零被引”状态等影响因素相比，期刊的声誉是期刊论文被引次数最重要的决定因素。一流期刊既能给其刊载的论文第二次生命周期，从而导致“睡美人”现象出现；也能引发更激烈的学术讨论（表现为短期内的大量引用），激烈讨论过后的平静导致“昙花一现”现象的出现。以心理学论文为对象的研究发现，与“睡美人”相比，“昙花一现”更多地出现在科学研究的热点中。从被引曲线上看，“全要素睡美人”是“昙花一现”与“睡美人”现象引文曲线的组合。

论文通常在发表之后的3-5年时间里迎来被引次数的峰值，此后，被引次数缓慢下跌。这种论文的引文曲线通常可以用对数正态（Lognormal）函数拟合。“昙花一现”与“睡美人”的引文峰值或过早或过迟，均偏离了普通论文的引文规律。那么，如何以定量的标准判断一篇论文是“昙花一现”、“睡美人”或者普通论文呢？

3.判定“睡美人”与“昙花一现”现象的定量标准

3.1基于平均值的标准

1989年，加菲尔德为“迟到的认可”设定的标准为“高被引”论文发表之后的前5年甚至10年以上的时间被引次数较低，大约平均一年被引1次。这种基于平均值的定量研究思路为后续的研究奠定了基础。

2003年，格兰泽（Glanzel）等人将“迟到的认可”定义为（a）发表后3年内只被引不超过1次，或（b）5年内只被引不超过2次，之后的15年里累计被引用至少100次。按照这一标准，他们从科学引文索引（Science Citation Index，SCI）数据库中1980年发表的54万篇论文里，找到77篇符合条件a、29篇符合条件b的论文。随后，将标准提高，把“累计被引用至少100次”改为“累计被引用50次且被引次数是影响因子的10倍及以上”，然后得到60篇符合条件a和16篇符合条件b的论文。他们也指出：之所以把时间窗口定义为3年或5年，是因为论文在发表后3-5年的时间里没有被引用的话，之后基本上就不会被引用了。2004年，格兰泽与加菲尔德将条件a中的时间窗口修改为5年，这样，发现“迟到的认可”的概率为0.013%。

2004年，范让（Van Raan）参照上述定量分析标准，提出了“睡美人”论文的定量标准：

（1）睡眠深度（cs），睡眠期每年被引最多1次（深度睡眠），或每年被引1-2次（浅度睡眠）；

（2）睡眠长度（s），一般为5年及以上；

（3）唤醒强度（cw），睡眠期之后4年里累计的被引次数，一般应大于20次，可划分为[20，30]，[30，40]，[40，50]，[50，60]，[>60]。

基于这3个变量的“睡美人”论文的特征包括：①深度的、长时间的睡眠之后，“睡美人”被唤醒的概率很低；②浅度睡眠的“睡美人”被唤醒的概率受睡眠长度影响较小；③唤醒强度越大的“睡美人”出现的概率越小，具体概率与睡眠深度和睡眠长度无关。

基于平均值标准对于唤醒时间的判断并不准确12引。图1所示的论文前31年累积被引用51次，年均被引用1.6次；此后的四年里累积被引用24次，按上述定义，可视为“睡美人”论文在第32-35年被唤醒。但是，从图1看，该论文被唤醒的时间比理论预测更晚一些。基于平均值的标准的另一个不足之处在于睡眠深度值、睡眠长度值、唤醒强度值的界定比较随意。如果这样可行，那么，我们需要重新思考加菲尔德在1980年代提出的问题：“论文发表之后10年未被引用，之后1年被引用10次，算迟到的认可吗？论文发表之后10年里每年被引用20次，之后1年被引用50次，算迟到的认可吗”？

参照范让的思路，还有学者定义了昙花一现的标准：

（1）论文发表之后2年内被引用超过10次，

（2）接下来的至少5年内每年平均被引用不超过2次。

按照这一标准，他们从58963篇诺贝尔奖获得者的论文中找到176篇符合条件的论文（占0.3%）。图2中的引文曲线符合这一标准。同理，基于平均值的“昙花一现”论文的定义也存在与“睡美人”相同的问题。

3.2基于分位数的标准

分位数与平均值孰利孰弊，已成为文献计量学领域的七大话题之一。正态分布是最常见的连续型概率分布之一，如果统计样本服从正态分布，那么观测值应该对称分布在样本均值的两侧。但是，格兰泽认为引文分布并不服从正态分布，因为绝大多数论文的被引次数在平均值以下，位于长尾的尾部。因此，他建议在选择统计方法与指标时，应采用分位数代替平均值。

基于分位数定量研究“睡美人”论文的标准源于普赖斯（Price）写给好友阿韦尔萨（Aversa）的私人信件。信中提到：科学论文有三种引文模式，25%的论文发表后被引次数以恒定速率增长，一直没有下降趋势；25%的论文发表后被引次数先快速增至峰值，然后以相近的速度递减；还有50%的论文发表后前几年被引次数以恒定速率增长，达到峰值后开始下降。阿韦尔萨在随后的研究中只发现两种基本的引文类型，即“慢增慢减”和“快增快减”；2003年，阿克斯尼斯（Aksnes）补充了第三种引文类型——“匀增慢减”，这3种引文类型与普赖斯的三种引文模式对应。2005年，范达伦（Van Dalen）和亨肯斯（Henkens）总结了上述3类引文类型，将“慢增慢减”视为“睡美人”，将“快增快减”视为“昙花一现”，将“匀增慢减”视为普通文献，并给出了基于平均值的定量分析标准。2010年，科斯塔斯（Costas）等人参照范达伦和亨肯斯的研究，提出一套基于分位数的定量分析标准。首先，查询目标论文的发表时间与发表之后每年的被引次数；其次，计算论文自发表至统计时累积50%的引文需要的时间（Y50%）；再次，统计与目标论文同年发表的同一学科内所有论文的Y50%值，从小到大依次排列，位于25%的论文的Y50%值为P25，位于75%的论文的Y50%值为P75；最后，用目标论文的Y50%值与P25和P75比较，判断目标论文所属的类型：

（1）“普通”型：最常见的引文曲线，P25

（2）“昙花一现”型：发表之后被大量引用，但持续时间较短，Y50%

（3）“迟到的认可”型：被认可的时间晚于常见的引文曲线，Y50%>P25。

科斯塔斯等人统计了816万篇论文后发现，上述三者的比例分别为70.4%、9.4%和20.2%。其中“迟到的认可”的比例远远超过格兰泽等人统计的0.013%。加菲尔德所说的论文（发表之后10年里每年被引用20次，之后1年被引用50次）所获得的认可，按照基于分位数的标准，很可能属于“迟到”，但按照基于平均值的标准，明显不属于“迟到”。

基于平均值的标准更能反映论文的“沉睡”状态，而基于分位数的标准更能反映“认可的迟到”状态。前者的条件严格，符合条件的文献数量较少；后者的条件宽松，符合条件的文献数量过多，但统计操作难度大。同时，这两套标准均因阈值设定过于主观而存在缺陷。

2015年5月，柯庆等人在美国科学院院刊上提出无参数的“睡美人”论文标准。该标准考虑了引文曲线的形态和峰值出现的位置两个要素。该标准最大的优势是避免了基于平均值与基本分位数标准中对于参数的主观设定（包括“年均被引次数小于2”、分位数中的“25%”与“75%”等）。该论文未提出“昙花一现”论文的无参数标准。2015年7月，孙建军等人在第15届国际科学计量与信息计量会议上，提出一套基于基尼系数的无参数定量标准，用于区分“睡美人”论文、“昙花一现”论文与普通论文。基尼系数是测度财富分布均衡性的指标。孙建军等人用该指标测算被引次数的分布均衡性，以测算值的大小判断被引次数高峰出现的位置以及被引曲线的形态，然后根据引文高峰出现的位置判断论文是“睡美人”、“昙花一现”，还是普通论文。

4.“睡美人”与“昙花一现”现象产生的原因探讨

“睡美人”现象产生的第一个原因是概念与方法超前。加菲尔德认为，孟德尔的论文《植物杂交实验》迟迟未被认可的原因在于其“遗传因子分离与组合”的概念与独特的“遗传学分析方法”均超出当时的科学认知，使其成为过早的科学发现。范让找到了一个特别的“睡美人”案例即罗曼斯（Romans）于1986年发表的论文。这篇论文发表之后直到1994年一直没有被引用过，但在1995年被波尔钦斯基（Polchinski）的论文（“睡美人的王子”）唤醒。梁立明等人结合超弦理论以及超弦理论的两次革命的背景，认为罗曼斯的论文走在了时代前面，以至于同时代的科学家看不到其科学意义。“睡美人”现象产生的第二个原因是主观排斥。引用过程容易受主观因素的影响。科学家们很可能因为一项科学发现的作者的年龄较小或学术地位不高而拒绝认可其学术贡献。其他阻碍科学发现被及时认可的主观因素还包括：宗教观念、学术声望、专长、专业协会、学术派系、年龄等等。此外，普赖斯认为作者的表达技巧也是造成不被认可的原因之一。他自己写过一篇关于累积优势的论文，因为用了大量的数学表达，所以论文迟迟得不到认可。望俊成等人从信息利用的角度，将“睡美人”被唤醒的过程视为信息唤醒，并总结唤醒的原因包括：信息价值被重新发现，信息的可获得性、可见度提高，信息需求增加等等。为了弄清上述两个原因中哪一个影响更大，科尔（Cole）从一项实证分析中发现，依据作者的年龄、所属机构、获奖等指标，并不足以从众多文献中找出“迟到的认可”的论文，因此，他认为论文的内容比作者的地位的影响更大。

“昙花一现”论文现象产生的第一个原因是技术更替。工程技术领域比人文社会科学领域出现更多的“昙花一现”论文，是因为工程技术领域所使用的技术手段频繁出现更替。新技术手段的出现导致原有技术手段退出学者们的视野，因此，原有技术手段的相关论文不再或较少被引用。“昙花一现”现象产生的第二个原因是研究主题转移。学术研究中也存在潮流。研究问题被解决或研究主题过时之后，研究注意力转向新的主题，旧的主题不再或较少被关注。此外，论文的外在属性也可能导致“昙花一现”现象的产生。一流期刊是一个强烈的学术信号，能催生快速引用，但并不能保证持续引用。因此，一流期刊比非一流期刊上出现昙花一现的概率更高。

5.讨论

学术界对被引次数的关注主要集中在高被引的论文、作者、机构等对象。以“h指数”为代表的指标，忽略了“低被引”与“零被引”论文。对于“睡美人”与“昙花一现”现象研究的意义在于将学术界的注意力吸引到“低被引”或“零被引”论文上。“睡美人”与“昙花一现”论文多数是“低被引”论文，沉睡期的“睡美人”也可能是“零被引”论文。“低被引”与“零被引”论文在学术评价中的价值值得深入挖掘。

对“睡美人”和“昙花一现”论文的研究，关注的都是科学文献的生命力与老化过程，而不仅仅是被引次数这个数值。从论文的被引曲线中，可以了解科学知识的生命周期与新老更替。从不同类型的被引曲线中，可以了解不同类型知识的生命周期的差异。因此，对论文中的“睡美人”和“昙花一现”现象的研究，可以为我们理解科学规律提供新的注脚。

关于论文的“睡美人”与“昙花一现”现象，进一步的研究应该集中在以下几方面。

（1）探索引文状态突变的影响机制。

在“睡美人”现象中，“王子”是谁？布劳温（Braun）等人认为“王子”应符合以下3个条件，即“公主”沉睡后第一次引用；被引次数相对较高；与“公主”共同被引用达一定的次数的论文。但是，按照这个标准，如果不借助论文所属领域的专业知识，很难找出唯一的“王子”。在进一步的研究中，“王子”的条件应该更严格，更符合学科特性。“王子”是如何发现“睡美人”的？如孟德尔的同行们是如何发现他的论文《植物杂交实验》的重要性的，这一问题似乎很难用定量的标准评判，但仍具有重要意义。

在论文的“昙花一现”现象中，学者们为何不约而同地放弃正在热烈讨论的研究主题而转向新的研究主题？这种默契的影响因素可能包括政策导向转移、权力干预、产业变革等，具体因素需要在进一步的实证研究中验证。如果能揭示引文状态突变的影响机制，就能更清楚地理解科学的运行机制，也能更准确地评判重要研究成果的价值。

（2）改进定量标准。

无参数标准是研究“睡美人”与“昙花一现”现象的趋势，但当前已有的标准还有待进一步完善。基于平均值与基于分位数的标准都因主观的阈值设定而存在不足。无参数标准虽然避免了主观的阈值设定，但在一些细节处理上仍存在不足。例如，柯庆等人的无参数标准只考虑了引文曲线中自论文发表至被引次数峰值的一段，而未考虑峰值过后的变化，那么，如果此后出现更高的峰值是否会改变“睡美人”被唤醒的时间。孙建军等人的标准并未计算“睡美人”被唤醒的时间。