基于CNKI 的中医药领域网络药理学知识图谱分析*

2024-02-22 05:27邹孟龙黄晓燕陈雅璐
西部中医药 2024年2期
关键词:图谱聚类中医药

邹孟龙,黄晓燕,陈雅璐,宁 芯

1 湖南中医药大学,湖南 长沙 410208; 2 广西中医药大学第一附属医院,广西 南宁 530023

中药是以中医基础理论为指导方向,临床用于防治疾病的药物的总称。中药已在我国发展了数千年,是祖先智慧的结晶,已经形成独特的治疗体系。近年来,中医药快速发展,在许多疑难杂症中发挥了重要作用。然而,如何使中医药走向现代化是目前亟待解决的问题。众所周知,中药通过多成分、多靶点、多通路相互作用而发挥防治疾病的作用。因此,通过药物活性成分与作用靶点的相互作用网络揭示中药防治疾病的分子机制是促进中药走向现代化的重要方法之一。

网络药理学(Network pharmacology,NP)是通过联合计算模拟与实验数据挖掘技术,整合大量信息,以探索药物作用靶点和分子机制的研究方法[1]。NP 揭示“中药-活性成分-基因靶点-疾病”相互作用的复杂网络,通过复杂网络预测药物的作用机制[2]。运用NP的研究思路探索中药的本质属性,揭示中医药多成分、多靶点、多通路的整体效应,这在中医药走向现代化的进程中发挥着重要作用。近年来,随着组学分析、高通量筛选等技术的逐渐成熟,为疾病数据库的构建提供了大量信息,NP 在中医药领域的相关文献同样逐年增长[3]。采用文献计量学的研究方法分析NP在中医药领域的发文情况,对该领域具有重要指导意义。

陈超美教授借助Java语言研发的CiteSpace软件主要用于分析文献中含有的潜在知识[4-6]。CiteSpace软件可以绘制不同类型的知识图谱,将大量文献信息进行可视化,目前已成为最流行的文献计量分析软件之一[7-9]。本研究运用CiteSpace软件分析NP 在中医药领域的发文量、作者分布、机构分布、关键词共现、关键词聚类、关键词突现等情况,为中医学者准确、及时且快速把握NP 在中医药领域的研究现状及发展趋势提供参考,促进NP在中医药领域的后续发展。

1 资料与方法

数据来源于中国知网(CNKI)。检索步骤为:主题词栏输入“网络药理学”,时间设为建库至2021 年2 月28 日,资源类型选择“学术期刊”,知识导航栏选择“中医学、中药学”。初步检索获得2872 篇相关文献,阅读文献题目及摘要,删除通知、广告、与主题明显不符等文献,将文献以“Refworks”格式导出,借助CiteSpac(e版本5.7.R2)软件删除重复文献,最终获得文献2474 篇。具体流程见图1。

图1 文献筛选流程图

2 结果

2.1 发表文献数量NP 在中医药领域的发展趋势可初步分为三个阶段。第一阶段:2006 年中医药领域开始出现NP 的相关文献,2006 年至2011年发展非常缓慢,这表明在该阶段NP 几乎没有引起我国中医学者的关注;第二阶段:2012 年至2017年,发文量逐年增长,年均56篇,这表明在该阶段NP 逐渐引起中医学者们的关注;第三阶段:2018 年至今,发文量成倍增趋势,其中2020 年发文量多达1053篇,这表明在该阶段NP已引起我国中医学者的广泛关注,目前研究热度较高。见图2。

图2 NP在中医药领域的发文量趋势图

2.2 文献作者运用CiteSpace 软件设置参数,Time span 选择“2006 至2021”,Years Per Slice选择“1 年”;Node types 选择“Author”,Pruing 选择“Pruing sliced networks”,其余参数选择默认,对文献作者进行绘制图谱(其中节点越大,发文量越多,连线代表作者之间的合作关系,不同颜色的联系表示不同年份,颜色越紫年份越远,颜色越黄则表示年份越近),见图3。

图3 作者共现网络图

由图3 可知,发文量较多的作者有张涛、李杰、郑景辉等。杨洪军连线较多,表明其与其他作者合作度较高。中介中心性是指某一结点作为其他两个结点之间最短路的桥梁的次数,若高于0.1,则可视为团队的核心成员。在本次分析中,中介中心性均低于0.1,表明NP 在中医药领域尚缺少核心研究者。另外,借助CiteSpace 软件进行突现分析。突现值越大,在一定程度上代表研究的创新性越强。结果显示王博龙团队突现强度最大,突现起始时间为2018 年,结束时间为2019年。这表明2018年至2019年期间,王博龙团队在NP方面的研究内容较为新颖。

2.3 研究机构运用CiteSpace 软件设置参数,Node types 选择“Institution”,其他参数与“2.2”项相同。本研究在分析时,合并机构名称中不同科室,仅保留医院名称和大学名称。发文量排名前5 的机构分别为:北京中医药大学、辽宁中医药大学、北京中医药大学东直门医院、辽宁中医药大学附属医院、山东中医药大学。见图4。

图4 机构共现网络图

2.4 关键词

2.4.1 关键词共现分析 运用CiteSpace 软件设置参数,Node types 选择“Keyword”,其他参数与“2.2”项相同。为了使统计结果更加清晰规范,本研究在分析时,将“作用机制”“机制”等同义词进行合并。见图5。

图5 关键词共现网络图

图6 关键词突现图谱

由图5 可知,除了“网络药理学”外,“作用机制”“分子对接”“靶点”“信号通路”“新型冠状病毒肺炎”“黄芪”“2 型糖尿病”“冠心病”等关键词出现的频次较多。这说明NP 在中医药领域的研究热点,主要集中在联合分子对接技术探讨中药调控作用靶点干预信号通路传导防治新型冠状病毒肺炎、2型糖尿病、冠心病等疾病方面。

2.4.2 关键词突现 基于“2.3.1”项的分析图谱,在控制面板中选择“Burstness”进行关键词突现分析。NP 在中医药领域研究文献的关键词突现图谱见图7。

其中“Year”表示关键词出现的年份;“Strength”表示突现的强度,强度越高则影响力越大;“Begin”“End”分别代表关键词突现的起止年份。本文将突现值居于前25 的关键词按突现的起止时间分为三个阶段。第一阶段:2006—2017年韦茎汤、贫血等关键词迅速增长,研究重点集中在单纯的NP研究;第二阶段:2018—2019年,NP在中医药领域的快速发展,以及各类疾病数据的建立,NP 结合生物信息学、数据挖掘等技术进行研究;第三阶段:2020—2021 年,NP 技术在中医药领域已经逐渐成熟,随着新型冠状病毒肺炎的爆发,NP 在研究中医药防治新型冠状病毒肺炎的作用机制中发挥着重要作用。

2.4.3 关键词共现聚类分析 基于“2.3.1”项的分析图谱,运用Log-Likelihood Ratio算法在关键词共现图谱的基础上进行聚类分析,共获得到NP在中医药领域研究的关键词共现聚类10个,见图7。

图谱中的不同色块代表不同聚类;聚类大小与聚类序号呈反比关系,即聚类越大则序号越小,所以#0 代表最大的聚类。聚类分析得到的图谱模块是整体结构的全局性度量,Modularity Q(模块化Q 值)与(Weighted Mean Silhouette S)平均轮廓S 值是评价图谱整体结构性能的关键指标。Q值>0.3表明图谱聚类有效;S值>0.5表明图谱中的聚类分析结果可信[10]。由图5 数据面板可知,Q 值=0.7629>0.3;S 值=0.9413>0.5,这表明该聚类分析有效且可信,具体聚类标签见表1(其中轮廓值越高,表明该聚类成员间的一致性越高;年份则表示聚类的平均引用年份,初步表明聚类的文章发表年代的远近)。结合图6与表1进行分析可知,聚类#0、#1、#2、#3、#4、#5、#6、#7 之间交集较多,联系较密切,#0 主要包括槲皮素、木犀草素、山柰酚、血管紧张素转化酶∏、柚皮素等关键词,围绕着对中药活性成分的作用机制研究;#1主要包括黄连、黄芪、质量标志物、动脉粥样硬化、指纹图谱等关键词,围绕着对单味药治疗心脏疾病方面的研究;#2 主要包括分子对接、溃疡性结肠炎、慢性心力衰竭、作用机制、槲皮素等关键词,围绕着NP 联合分子对接在治疗溃疡性结肠炎方面的研究;#3 侧重于聚类目前NP 研究较多的中药;#4侧重于NP联合数据挖掘在治疗肿瘤方面的研究;#5、#7、#8分半侧重于对2型糖尿病、重症肌无力、胃癌前病变方面的研究;#6则侧重于聚类NP的研究方法;#9 轮廓值为0,表明聚类成员一致性较差。聚类#0、#1、#3、#5、#7、#9可归为NP在不同中药的研究情况,聚类#2、#6、#8可归为NP的研究方法,聚类#4可归为NP在不同疾病的研究情况。

表1 关键词聚类标签

3 讨论

本研究运用CiteSpace软件将NP在中医药领域的发文量、作者分布、机构分布、研究热点及趋势的发展演变绘制成可视化图谱,初步梳理了NP在中医药领域的研究现状。NP 在中医药领域的相关文献主要发表于2006 年后,2006—2017 年发文量相对较少,2017年后NP在中医药领域的文献量明显增多。分析发现,这与2017年多篇NP方法学的文献相关[11-13]。在这些文献中,详细地分析了NP 常用数据库的优缺点、NP 的步骤及方法,这极大地推广了NP 在中医药领域的应用。本领域具有影响力的机构是北京中医药大学、辽宁中医药大学、北京中医药大学东直门医院、辽宁中医药大学附属医院、山东中医药大学,合作关系多为大学与其附属医院之间的合作,各大学之间及各医院之间的合作较少。

关键词通常是对一篇文章核心内容和主要信息的凝练。共现分析是将大数据中,共同信息进行定量化的分析方法,可揭示内容关联所隐含的共现关系,反映某领域的研究热点[14]。文章关键词之间存在着一定的关联,用共现的频次表示这种关联,定义为关键词共现分析。关键词共现聚类分析是在关键词共现分析的基础上的进一步分析,借助计算机的Log-Likelihood Ratio 算法将大量关键词根据同质性进行归类,反映某领域内的基本知识结构[15]。突现是指关键词在某段时间内使用频次突然激增,通常被作为分析某领域某段时间的研究热点[16-17]。本研究通过CiteSpace软件对纳入文献的关键词进行分析,结合共现分析、聚类分析以及突现分析的结果,可以发现目前NP 在中医药领域的关键词可归纳3 类:描述NP 方法学的关键词、描述疾病的关键词和描述中药的关键词。NP 应用于中医药领域的主要目的是研究中药的作用机制,为临床中药的运用提供理论依据[18]。“靶点”“信号通路”“作用机制”等描述方法的关键词出现的频次较高,这再次验证了NP 应用的主要目的。同时,这也表明了纳入文献与研究主题相符合。本次研究发现,NP 在中医药领域关注的疾病主要是“新型冠状病毒肺炎”“2 型糖尿病”“冠心病”等,关注的中药主要是“黄芪”“黄连”“丹参”“人参”等。新型冠状病毒肺炎是21 世纪以来最大规模的传染性疾病,由于缺乏特效治疗药物,对社会稳定及经济发展造成巨大的影响[19]。新型冠状病毒肺炎可归属于中医“疫病”范畴,而中医药历经数千年的发展,对于防治“疫病”已积累了一定的经验,且以天人合一、辨证论治等理念为指导方向,形成了独特的诊疗体系。在疫情的防控过程中,全国各地名老中医纷纷献出“抗疫方”[20-23]。学者们借助NP的研究思路分析“抗疫方”的作用机制,为临床运用提供理论依据,在中医药参与防控疫情中发挥着重要作用[24-26]。黄芪在《本草纲目》中被列为上品药。药理研究表明,黄芪的药效成分包括黄芪多糖、黄芪甲苷、生物碱等,具有抗肿瘤、调节血压、保护心脑血管、营养视网膜神经节细胞及防治糖尿病血管并发症等方面的作用。这表明黄芪在中医药领域中具有重要地位。总而言之,黄芪、黄连、丹参、人参等中药及新型冠状病毒肺炎、2 型糖尿病、冠心病等疾病是NP在中医药领域研究的主要热点。值得提出的是,NP 在中医药领域所关注的中药及疾病种类较多,涉及的疾病包含消化系统疾病、免疫系统疾病、肿瘤等,涉及的中药包含中药复方、中药单味药,而“白芍”“甘草”“血管紧张素转化酶∏”等关键词在近几年的突现值较高,这在一定程度上代表了NP在中医药领域的发展趋势。

本研究运用CiteSpace软件绘制NP在中医药领域发展的知识图谱,分析该领域的研究现状及发展趋势。与传统综述的人工梳理方法相比,知识图谱可以高效快捷地提取文献的主要信息,节省了大量的人力时间。不仅如此,将整理的信息绘制成可视化的知识图谱,更有利于生动地展示NP在中医药领域方面的发展演变。

值得注意的是,本研究尚存在一定的局限性。首先,本研究只纳入CNKI 数据库,而万方、维普、PubMed 等常用数据库的相关文献均没有被纳入,故本研究结果仅代表CNKI 数据库的情况。其次,本研究结果是基于文献的关键词进行分析,而某些文章关键词较为混乱,能否代表该领域的研究主题有待进一步考证。

4 结论

NP在中医药领域的应用研究从2006 年开始,2017 年之后发文量剧增,合作发文主要集中在机构内部。分析文献的关键词可以发现NP 在中医药领域的研究热点主要集中于黄芪、黄连、丹参、人参等中药治疗新型冠状病毒肺炎、2 型糖尿病、冠心病等疾病的作用机制。

猜你喜欢
图谱聚类中医药
中医药在恶性肿瘤防治中的应用
中医药在治疗恶性肿瘤骨转移中的应用
绘一张成长图谱
基于DBSACN聚类算法的XML文档聚类
从《中医药法》看直销
补肾强身片UPLC指纹图谱
基于高斯混合聚类的阵列干涉SAR三维成像
中医药立法:不是“管”而是“促”
主动对接你思维的知识图谱
一种层次初始的聚类个数自适应的聚类方法研究