基于CiteSpace 的类风湿关节炎研究可视化分析*

2021-11-19 06:56兰维娅唐芳马武开黄颖徐晖陆道敏杜伟蒋总
河南中医 2021年12期
关键词:发文图谱可视化

兰维娅,唐芳,马武开,黄颖,徐晖,陆道敏,杜伟,蒋总

贵州中医药大学第二附属医院,贵州 贵阳 550001

类风湿关节炎(rheumatoid arthritis,RA)是以对称性多关节滑膜异常增殖为主的自身免疫性疾病[1-4]。该病致残率高,我国RA患者病程5~10年、10~15年、≥15年的致残率分别为43.5%、48.1%、61.3%[5],严重影响患者的生活质量,给社会和患者家庭带来经济负担[6-8]。

中医学把RA归属于“痹证”范畴[9-10]。《素问·痹论》曰:“风寒湿三气杂至合而为痹也。”《类证治裁·痹症论治》言:“诸痹,风寒湿三气杂合,而犯其经络之阴也。风多则引注,寒多则掣痛,湿多则重着,良由营卫先虚,腠理不密,风寒湿乘虚内袭,正气为邪气所阻,不能宣行,因而留滞,气血凝涩,久而成痹。”虽然对该病研究早,研究时间跨度不长,尚处于积累时期,仍缺乏对该领域的研究方向、热点和发展趋势评判的系统研究,需要科学可行的方法进行梳理、归纳,分析该领域研究方向、热点和发展趋势,挖掘潜在的研究热点,为相关研究提供参考。

CiteSpace是由Drexel大学信息科学与技术学院的陈超美教授开发的科学文献计量自动化软件[11],能够识别趋势和演示新动态的信息可视化工具,以其良好的稳定性、可读性、丰富性,成为医学文献信息分析的重要工具[12-17]。

本文以中国知网数据库为来源,应用CiteSpace 5.5软件的共现分析功能,对2010—2020年关于RA的相关研究进行可视化,分析该研究领域的历史、当前研究及发展趋势,旨在为后续相关研究提供一定的参考依据。

1 研究设计

1.1 研究方法CiteSpace软件可以直观地分析相关研究领域中的文献,并以科学知识图的形式将其呈现出来。帮助我们梳理过去的研究轨迹,在视觉知识地图上,将相关研究领域的关键引文节点自动识别,并呈现以共现和共引聚类为特征的研究前沿[18],有助于研究并掌握该领域的研究热点和方向。本研究使用CiteSpace5.5可视化软件对RA相关文献进行可视化分析,探讨该领域的现状、热点和未来的研究方向。

1.2 数据来源及处理确保文献数据来源的质量,文献类别设置为“核心期刊”“EI”“CSCD”和“SCI”,学科分类目录为医药卫生科技,经检索得到 4 171 篇相关文献。然后以Refworks格式及Excel表格导出获取的数据。删除会议、通知、新闻等文献,获取共3 346篇有效文献,然后对其进行分析。

1.3 研究过程本研究先对3 346篇有效文献进行分析,然后使用CiteSpace5.5软件将其转换为WOS格式,并导入转换后的数据。对参数进行调整:时间范围和时间切片(TimeSlicing),网络节点类型(NodeTypes),网络参数选择(SelectionCriteria),修剪算法(Pruning)选择等,文献数据的作者协同分析,关键词共现分析,时区图(Timezone)、突现词探测(Burstdetection)等,进一步绘制RA相关研究领域的知识图谱,揭示研究领域的知识基础、研究进展和研究前沿。

2 结果

2.1 整体概况发表论文的数量在一定的时期内不仅可以展示学科的发展速度,也反映了研究者对该学科的关注程度[19]。通过对历年3 057篇有效文献进行统计分析,得到2010—2020年的发文量见图1。分析可知,在2010—2017年,关于RA的文献发文量呈平稳上升趋势,平均每年发文量292篇,最高发文量达360篇。本文自2010年开始统计,对2010年之前的文献未纳入统计,经对中国知网数据库相关文献数据查询,可以看出2010—2020年已进入较成熟平稳发展阶段。

图1 2010—2020年相关文献发文量分布图

发文量30篇以上的有6位作者,排名依次为刘健(50篇),吕爱萍(31篇),林昌松(31篇),马武开(30篇),姜泉(30篇),魏伟(30篇)。发文量排名前20位见表1。

表1 RA研究部分高产作者统计表

对文献来源进行统计分析,发表文献涉及RA研究领域共有260个相关期刊,其中发文量最多的为《中国免疫学杂志》,可见相关领域的研究和免疫学联系紧密。其中载文量排行前三位的依次为《中国免疫学杂志》140篇,《中国老年学杂志》117篇,《中华中医药杂志》100篇。其中发文量在50篇以上的机构见表2。

表2 RA研究发文期刊分布

2.2 合作分析合作网络分析可以看出某个研究领域的作者与机构之间的合作关系,为评估某个研究领域的学者和机构提供参考,更有利于发现那些关键的研究人员或研究机构。通过CiteSpace软件得到的组合共现图谱可以发现学者及其在特定研究领域中联系[18,20-22]。将所有参考书目导入软件,将时间片设置为1,然后为“节点类型”设置选择“作者”和“机构”,其他参数保持不变,见图2、图3。

图2 作者合作图谱

图3 机构合作图谱

由图2可知,近10年来出现以蒋永福、韩继章及李国新为代表的研究团队,图谱中的节点大小代表发文量,连线表示合作强度。从连线可以看出,近10年在该领域作者之间合作并不密切。图3生成的机构合作图谱节点共157个,连线数共58条。节点代表机构名称,节点的大小代表机构在该领域的影响力的大小,连线代表合作关系,粗细代表机构合作的强弱。由图3可知,近10年来中国在RA研究领域,北京大学信息管理系、国家图书馆、武汉大学信息管理学院、华南师范大学经济与管理学院等研究机构合作较紧密。此外,南京大学信息管理系、河南大学信息研究所以及安徽大学管理学院、南京大学信息管理学院研究机构有一定合作关系。

2.3 知识演进(聚类、时区、突现词)关键词是一篇学术论文中频繁出现的术语,是一篇文献中的核心词汇,反映了其研究的方向,一般认为关键词能够反映文章的内容[18,23]。时区视图可以比较清晰地反映出各个时期知识演化,随时间推移而更新及其相互影响[24-25]。新建项目,将相关数据导入CiteSpace软件,选择节点类型为关键词,选择时间范围,时间切片为1,选择TOP 50,运行数据并经过调整,得到关键词共现时区图谱见图4。通过对RA相关文献进行分析得到的关键词共现时区图谱,可以直观地反映出随时间推移相关研究领域的研究演变过程以及各个时期的研究热点,发现我国RA知识领域的研究演进历程。

图4 关键词共现时区图谱及高频关键词

聚类视图[18]重点反映聚类之间的关系,以及每个聚类中相关文献的历史跨度。以关键词为节点类型进行分析,生成的图形以LLR算法进行聚类分析,共生成14个聚类,见图5。生成的14个聚类的详细信息见表3。

表3 关键词聚类信息及对应LLR算法下高强度词频

CiteSpace依据网络结构和聚类的清晰度,Q值代表模块值,S值代表平均轮廓值,Q值、S值作为我们评判图谱绘制效果的一个依据,当Q>0.3意味着划分出来的社团结构是显著的;当S值为0.7时,聚类令人信服,若在0.5以上,聚类是合理的[18,26]。由图5可知,Q值为0.817 5,S值为0.755 2,说明聚类图谱比较合理。

图5 关键词共现聚类视图

Citespace5.5软件中的突现词探测可以探测在一定时间内某个研究领域内某个研究主题受关注度突然呈现爆发式增长,能够反映出相关研究领域的研究前沿。2010—2020年RA相关研究进行突现词探测,共生成25个突现词,突现强度最高的关键词为治疗,其次为类风湿因子、血管内皮生长因子、抗环瓜氨酸肽抗体、活动期、滑膜、滑膜病等。见图6。

图6 关键词突现探测(Top 25)

2.4 知识基础与新兴热点高被引文献在一定程度上代表了该研究领域重要的知识基础文献。而在这一知识域内的所有文献中,某一时间段内的相关文献的下载量,在一定程度上也反映了一定时期内某个研究课题在研究领域中的关注程度[27-28]。

一定时期内的高下载量的文献即为这个时期内的高热度文献。综合参考分析发现,一定时期内识别出某一研究领域的研究热点。2010—2020年RA相关文献中高引用文献和高下载文献,见表4、表5。可看出近10年的高被引文献、高热度文献主要集中在2010—2014年,该时期的相关研究具有一定趋势引导作用。

表4 2010-2020年高被引文献

表5 2010—2020年高下载文献

3 讨论

RA为临床高发病率的疾病,通过文献挖掘技术与Citespace软件可视化图谱可以有效、直观地分析该领域的研究现状与研究热点[45-47]。CiteSpace软件是基于Java语言开发的信息可视化软件,可根据不同的分析元素对绘制的知识图谱进行切割和计算,把数据分析映射在二维、三维图形中,达到对该领域内研究文献的引文、作者、关键词的时间空间多元共现分析,从宏观、微观等多层面展现学术网络结构和动态变化,是文献计量学研究的重要工具[48-49]。本研究基于CiteSpace5.5软件对2010—2020年纳入的3 346篇文献的作者、研究机构、关键词及高被引文献进行可视化分析。

从发文趋势分析可知,该领域近10年来发文量较为平稳,发展较为成熟。发文量高的作者主要有刘健、吕爱平、林昌松、马武开、姜泉、魏伟等,出现一批年轻的代表人物,代表着RA领域内研究方向的转变,代表着风湿免疫领域研究的崛起,对推动该领域发展有积极作用。从机构合作图谱可以看出,北京大学信息管理系、国家图书馆、武汉大学信息管理学院等研究机构具有一定合作关系,形成多中心合作,其他机构多为两两合作,机构之间的密切合作有助于成果共享、资源整合。从合作网络分析可以看出,近10年在该领域的作者之间合作并不密切,研究力量较分散,研究范围虽广,未形成稳定研究团队,缺乏影响力大、贡献突出的领军人物,优势资源不能获得良好的整合与利用,提示应加强团队间的合作交流。对文献来源进行统计分析得出,发文量最多的为《中国免疫学》杂志,可以看出对关注点仍然集中在免疫领域,提示免疫疾病研究的兴起。关键词可视化方面,从突现强度高的关键词来看,近年来研究热点主要集中在RA发病机制、检测指标、西药研究等领域。目前RA 确切发病机制未明,环境和遗传因素相互作用共同促进了RA 的发病,开展对RA发病机制的研究有望解决世界难题。随着对自身免疫病病理机制的深入阐明和新药物靶点的发现,靶向细胞因子如JAK抑制剂和新型生物制剂获得较快发展,突现词探测有肿瘤坏死因子,代表药物有英夫利昔单抗;英夫利昔单抗是人鼠嵌合性肿瘤坏死因子-α 单克隆抗体,RA 患者具有满意疗效,早期应用的效果好。JAK抑制剂和新型生物制剂虽然疗效显著,但也存在免疫抑制、骨髓抑制、感染、新生肿瘤等不良反应,目前的研究水平仍有提升的空间,研究成果在临床运用上范围较局限,中医药治疗的优势尚未完全发挥。

RA发病率逐年上升,其发病机制至今未阐明,对RA的研究亟需深化,可从多层次、多中心进一步探讨研究,加强机构之间合作。部分研究缺乏严格的科研设计,论证强度不高,研究结果未能被合理高效的扩展应用。文献计量学[7]是使用定量方法来评估每个研究领域的知识结构和发展背景,在多个领域文献研究中已经被广泛使用。运用CiteSpace软件进行可视化图谱,梳理原始数据和资料,可揭示该领域的研究方向、热点和发展趋势,为该领域探寻新的思路与方向提供了参考。根据可视化分析结果可以看出RA当前的研究热点,对研究热点及未来的研究方向是今后工作的重点方向。作为中医药学术传承者,如何利用好中医药治疗RA的疗效优势,进一步探索RA发病机制、疗效标准、治疗规范是以后的研究中应该思考和解决的问题。

通过CiteSpace软件的分析可以得到目前RA研究的现况和未来的研究热点,但本研究仍存在以下不足:①文献来源未涉及其他数据库的相关内容,可能导致信息不全;②节点信息较单一,这些不足在以后的研究中有待于进一步完善。

猜你喜欢
发文图谱可视化
基于CiteSpace的足三里穴研究可视化分析
基于Power BI的油田注水运行动态分析与可视化展示
绘一张成长图谱
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
补肾强身片UPLC指纹图谱
主动对接你思维的知识图谱
杂草图谱