基于CiteSpace的舌诊客观化研究领域科学知识图谱与可视化分析*

2021-04-12 05:35王东军朱青青余静寅钟慧慧关媛媛王泓午
世界科学技术-中医药现代化 2021年1期
关键词:客观化舌象发文

王东军,朱青青,余静寅,钟慧慧,孙 璇,关媛媛,王泓午**

(1. 天津中医药大学健康科学与工程学院 天津 301617;2. 北京中医药大学东方学院 廊坊 065000)

舌诊是中医学中具有特色诊断的方法,舌诊在中医辨证诊疗中具有重要的作用。舌诊是通过观察人体舌象变化诊察疾病的传统诊疗手段。随着互联网、计算机等技术的发展,中医舌诊的客观化研究取得了较大成绩。舌象客观化是在传统中医舌诊理论的指导下,通过图像识别技术开展研究。舌诊客观化研究主要依赖图像识别技术,将标准化收集的舌象经过图像校正、图像去噪、舌象分割等预处理,通过对舌质、舌苔颜色和形态特征分析总结[1]。在研究大量舌诊数据的基础上,模拟临床诊疗过程[2],利用“舌诊”客观辅助诊疗技术采集客观数据,为疾病诊疗提供客观基础[3]。将信息、知识等抽象数据以直观可视的形式呈现出来有利于数据分析、知识发现、规律探索[4]。近年来科学知识图谱——科学计量学的新方法在我国发展迅速。科学知识图谱以知识域为对象,显示科学知识的发展进程与结构关系的一种图像,呈现知识单元或知识群之间网络、结构、演化或衍生等隐含的复杂关系[5]。CiteSpaceⅡ软件是新一代信息可视化工具,通过绘制相关研究领域的知识图谱,展示发展动向与趋势,呈现研究前沿领域的热点和发展历程[6]。应用科学计量可视化方法进行舌诊客观化研究的文献尚不多见,因此应用CiteSpace 归纳中医舌诊客观化研究热点和前沿十分必要。本文通过检索中国知网(CNKI)近20年中医舌诊客观化研究领域相关文献,应用CiteSpace 软件V5.7R1版本的共现分析功能,对中医舌诊客观化研究领域的有关文献的作者、研究机构、关键词进行合作网络共现分析,总结该研究领域近20年的现状、趋势、热点前沿。本研究内容依托国家科技部“十三五”国家重点研发计划中医药现代化研究重点专项(2017YFC1703305):中医舌象诊断规范与标准研究及应用,通过应用CiteSpace 软件分析中医舌诊客观化研究现状及发展规律,为中医舌象诊断规范与标准研究奠定基础。

图1 舌客观化研究发表文献时间分布

1 资料与方法

1.1 文献检索及策略

检索条件:发表时间between(2001-01-01,2019-12-31)并且(((主题= 舌诊或者题名= 舌诊或者v_subject=中英文扩展(舌诊)或者title=中英文扩展(舌诊))或者(主题= 舌象或者题名= 舌象或者v_subject=中英文扩展(舌象)或者title=中英文扩展(舌象)))并且(主题=客观化或者题名=客观化或者v_subject=中英文扩展(客观化)或者title=中英文扩展(客观化)))(模糊匹配)。文献类型为期刊、学位论文、会议论文。检索到文献总数:457 篇。人工检索去重后,得到有效文献407篇。

1.2 研究方法

统计发表文献数量、作者、研究机构等,应用CiteSpace 软件5.7 对发文作者、研究机构、关键词进行可视化分析。将上述文献以refworks 格式导出,规范为CiteSpace 软件可以识别的“download_”格式,导入CiteSpace5.7软件中,将文献进行研究机构、作者、关键词共现及聚类分析。软件参数设置:Time Slicing 模块下,设置时间跨度为2001年-2019年,时间分区以1年为1 个单位;设置“Title”“Abstract”“Author Keywords”。将节点类型(Node Type)设置为“Keywords”;对象间的连接强度(Link Strength)选择“Cosine”,范围(Scope)选择“With Slices”;数据删选标准(Selection Criteria)设置“TopN”分别为50,筛选出每1年中出现频率最高的前50 名关键词;g-index(k= 25,LRF = 3.0,LBY = 8,e=2.0)。修剪选项(Pruning):关键路径(Pathfinder)。选择对数似然比(Log-likelihood ratio,LLR)算法、浅语义索引(Latent Semantic Idexing,LSI)算法对关键词进行聚类分析并标记聚类标签。

2 结果

2.1 发表文献时间及主题分布

以每1年为1 个时间区间,分析2001年-2019年的相关文献发表情况,近20年中国知网关于舌诊客观化研究领域刊载相关文献407 篇,整体上呈波浪式上升趋势,2003-2006年、2008年-2010年发文数量快速增长,特别是2009年载文数量最多(图1)。主要研究主题包括中医舌诊、舌诊客观化、中医舌象、中医诊断、图像分割、图像处理、特征提取、冠心病、颜色特征、中医证型、慢性乙型肝炎等热点内容(图2)。

2.2 高频作者合作网络分析

分析纳入文献可知,近20年发表过该研究领域相关文献的作者共437 人,发文量前20 的作者中,发文30篇的王忆勤是发文量最高的作者(表1)。由此可计算该研究领域的核心作者人数。核心作者最低发文量N= 0.749 ×ηmax1/2(ηmax 即最高产作者的发文量)[7],ηmax=30,可得N≈4。核心作者共39人,占所有发文人数的8.92%。根据赖普斯定律,核心作者的发文量应占文献总数的一半,故该研究领域尚未形成核心作者团队。高产作者合作网络形成以许家佗、陆小左、沈兰荪、吴劲松为代表的4个较大的研究团队(图3)。

2.3 研究机构合作网络分析

应用CiteSpace 软件绘制“中医舌诊客观化”研究机构合作图谱(图4),图中每个同心圆环的大小代表机构的发文量,圆环越大说明发文数量越多。节点之间的连线粗细代表不同机构之间的合作强度。其网络密度为0.0072,包含208个节点,155条连线,呈现该研究领域的机构合作态势。高产机构发文量前20 中上海中医药大学发文数量最多,发文62 篇,为最高产的研究机构(表2)。由高产机构发文量前10空间分布可知,该领域研究机构主要分布在上海、天津、北京、广东等东部沿海地区;中、西部地区研究机构分布不足。中心性是测度节点在网络中的重要性的一个指标,用来发现和衡量文献的重要性,并用紫色圈进行标注[8]。上海中医药大学对该领域研究开展较早,且长期处于学术领先地位。上海中医药大学、天津中医药大学、上海中医药大学附属曙光医院、北京工业大学等研究机构发文数量较多。高产机构中心性偏低,在学术领域内还缺乏较强的影响力。图4可见该领域研究机构整体上分布较分散,主要形成了以上海中医药大学、天津中医药大学为中心的2 个较大的合作网络,在研究机构网络中发挥重要的“桥梁”作用,是连接华东、华北、华南地区研究“阵地”的关键节点。

图2 中国知网所载文献主题(前20)分布

表1 发文量前20作者情况表

2.4 载文期刊情况分析

图3 高产作者共现网络分析

纳入的文献中有234 篇为期刊论文,其中发表在核心期刊中的论文有184篇(78.6%),发表在非核心期刊的论文有50 篇(21.4%)。其中载文量最多的期刊为《中华中医药杂志》,累计发文14 篇,占纳入期刊文献总数的5.98%。根据普赖斯定律,本文核心期刊最低文献量m== 2.802,取整数为3,载文量3篇以上的期刊共计28 本,2001年-2019年累计刊载中医舌诊客观化研究领域文献147 篇,占期刊文献总量的62.8%>50%,符合普赖斯定律的要求。表明该研究领域核心期刊已经形成。中医舌诊客观化研究领域刊文量在前20期刊情况(表3)。

图4 研究机构合作网络共现图谱

表2 研究机构前10分布情况表

表3 中医舌诊客观化研究文献刊载期刊前20统计表

2.5 关键词共现与聚类分析

关键词反映该文献的主要研究内容和热点,通过对科学文献中的关键词进行聚类分析,总结近20年来该研究领域的发展历程、研究方向、研究热点。应用CiteSpace 软件对文献中的关键词进行提取,并绘制关键词共现网络。共现次数为关键词出现的次数,通过高频关键词呈现该领域的研究热点[9]。中介中心性高的节点往往位于连接2 个不同聚类的路径上,用来确定群体的算法就是利用这个特点来区分网络中的聚类[10]。该领域研究文献的关键词共现知识图谱(图5),图谱包含451 个节点,1019 条连线,其网络密度为0.01。共计451 个关键词,统计频次前20 关键词和中心性(表4)。由表4可见舌诊、舌象、舌诊客观化、客观化研究、图像分割等为出现频率较高的关键词。中心性强的关键词,出现的频率多较高。由图5 可见该研究领域起到“桥梁”作用的关键词(中心性>0.1)有5个,如“舌诊”节点出现频次最高(130 次),中心性最高(0.71);“舌象”节点出现64次,其中心性为0.35;“客观化”频次为62,其中心性为0.25;“舌诊客观化”频次为54,其中心性为0.36;“客观化研究”频次为16,其中心性为0.17。在关键词共现网络视图(图5)的基础上,进行关键词聚类分析,采用对数似然比(LLR)算法对聚类进行标记,可以更清晰地展示该研究领域的载文热点(图6、表5)。聚类模块值(Modularity)Q值=0.6939,Q≥0.5 聚类结构显著;聚类平均轮廓值(Silhouette)S值= 0.5748,S值>0.5,聚类结果合理;表明该图谱能较好地反映文献的研究热点。该研究领域关键词聚类分析形成14 个较为合理的聚类(S值均>0.7):#0 舌诊、#1 舌诊客观化、#2 客观化、#3 舌象、#4 流行病学、#5 客观化研究、#6 中医、#7 慢性乙型肝炎、#8 齿痕、#9小波变换、#10 体质、#11 显色性、#13 图象分割、#14 信息分析系统。应用浅语义索引(LSI 算法)对关键词聚类进行标注(图7),并总结其主要研究方向:#0基于近红外光谱的舌诊疾病识别的研究、#1 中医舌象分析仪的实用化研究、#2 慢性乙型重型肝炎阳毒内盛证色诊客观化研究、#3 冠心病患者中医证型、舌象与冠脉造影结果相关性的研究、#4 原发性高血压病中医舌象与证候的相关性研究、#5 中医病证智能化诊断与分类研究进展、#6 人体舌苔的反射光谱特征分析、#7 慢性乙型肝炎舌诊客观化临床观察、#8 舌诊中若干图像分析关键技术的研究、#9 舌象信息的采集处理及模式识别、#10 子宫肌瘤患者舌苔脱落细胞成熟度与体质的相关性研究、#11 舌象信息客观化研究中光源选择初探、#13 彩色图象分割及其在中医舌图象处理中的应用、#14 应用舌诊综合信息分析系统对原发性肝癌舌质颜色的定量分析。将关键词聚类共现知识图谱转换为Time Line 聚类时间线图(图8)和Time Zone 时区演化图(图9),并检测突现词(Citation Burst)(图10),可清晰地发现近年来该领域的研究热点、前沿内容。

图5 中医舌诊客观化研究领域关键词共现网络视图

图6 中医舌诊客观化研究文献关键词聚类(LLR算法)视图

表4 舌诊客观化研究文献关键词前20分布情况表

表5 舌诊客观化研究文献关键词聚类分析

图7 中医舌诊客观化研究文献关键词聚类(LSI算法)视图

图8 中医舌诊客观化研究文献关键词聚类(#0-8)Time Line时间线图

图9 中医舌诊客观化研究文献关键词聚类Time Zone时区演化图

图10 中医舌诊客观化研究关键词(TOP20)突现图

3 结果

3.1 中医舌诊客观化研究时间、空间分布

近年来中国知网刊载中医舌诊客观化研究领域文献呈上升趋势,2003年-2006年、2008年-2010年发文数量快速增长,特别是2009年载文数量最多。该领域研究主题主要包括中医舌诊、舌诊客观化、中医舌象、中医诊断、图像分割、图像处理、颜色空间、特征提取、冠心病、颜色特征、中医证型、慢性乙型肝炎等热点内容。该研究领域核心期刊已经形成。相关文献的作者共437人,核心作者的整体发文数量不足,该研究领域尚未形成核心作者团队。高产作者其网络密度较低,作者分布较分散,初步形成了形成以许家佗、陆小左、沈兰荪、吴劲松为代表的四个较大的研究团队。上海中医药大学在该研究领域长期保持领先地位。研究机构主要分布在东部沿海地区;中、西部地区研究机构分布不足,这可能与地区间科技发展水平不均衡有关。

3.2 中医舌诊客观化研究热点与前沿分析

通过对关键词进行突变分析,突变强度最高的关键词为舌诊客观化(3.7655),其他突变强度较高的关键词有颜色分析、中轴变换、模式识别、图像分割、图像分析技术、慢性乙型肝炎、中医现代化、原发性肝癌、定量分析、舌诊专家系统等。2003年-2005年数字舌图、彩色校正、彩色纹理分割、图像分割技术、中轴变换、原发性肝癌等内容研究热度较高;2006年-2007年层次分析法、舌象采集、舌诊专家系统、心脑血管病、定量分析、纹理分析、颜色分析、中医药现代化、神经网络等为研究热点;2008年-2010年研究热点有模式识别、原发性肾小球疾病、舌象仪等;2011年-2012年研究热点内容为数字图像处理、医学摄影、数字化舌象分析仪、近红外光谱、最小二乘法、临床应用等;2015年-2019年研究的热点和前沿有2 型糖尿病、bp 神经网络、数据挖掘、舌脉象参数、中医四诊客观化、三维重建、舌象特征提取、Snakes 算法、舌象分割、三维舌象仪、支持向量机等内容。通过关键词聚类分析与突变分析,总结其主要研究的热点内容包括3部分:

3.2.1 中医病证智能化诊断与分类研究

具体包括慢性乙型肝炎色诊客观化研究、冠心病患者中医证型、舌象与冠脉造影结果相关性的研究、原发性高血压病中医舌象与证候的相关性研究、慢性乙型肝炎舌诊客观化临床观察、原发性肝癌舌质颜色的定量分析等热点内容。笔者认为应用中医舌象智能辅助诊断系统、计算机与图像处理技术对相关疾病患者舌象和舌象参数、中医证候指标进行观察和定量分析,是中医舌诊客观化研究的重要途径,具有重要的意义。

3.2.2 舌诊图像识别、图像分割、图像处理、图像分析关键技术

笔者认为在中医舌诊客观化研究过程中,舌象识别与图像分割、图像分析技术是关键技术。在研究过程中通过数字图像处理的方法对舌象进行分析、识别、诊断;基于彩色信息区分度和小波变换的彩色边缘检测方法提取舌象。在颜色、纹理、边缘检测分割法的基础上,应用改进的Snake 算法对进行舌象分割。采用聚类邻算法等获得舌象的颜色分布,还原立体舌象,重建三维舌象的光度立体法[11]。

3.2.3 中医舌象分析仪、图像采集设备的实用化研究

具体包括数字化中医舌象分析仪、舌诊综合信息分析系统、舌诊专家系统、图像采集设备的研发等。笔者认为舌象分析仪研发和使用有利于突破传统舌诊方法的局限性,对中医的临床诊断、教学、科研具有重要的意义。通过舌象仪、中医舌诊综合信息分析系统等的推广和应用,有利于规范地、标准地采集患者舌诊信息,形成定量化、客观化的舌诊宏观参数和微观参数,为后续中医舌象量化诊断、标准和规范的制订奠定基础。

3.3 中医舌诊客观化研究面临的问题与展望

①该领域的核心研究力量不足,整体分布较分散。②研究机构跨区域合作不足,存在一定的学术壁垒。③研究机构中心性偏低,在学术领域内还缺乏较强的影响力;研究机构整体以中医药大学及附属医院为主,其他科研院所对该领域研究不足。④该领域研究区域发展不均衡,主要的研究阵地集中在经济发达的东部沿海地区。因此笔者认为在中医理论的指导下,通过运用图像处理技术、计算机技术,结合中医专家的临床经验,进行舌象分析,实现舌诊定量化、客观化的研究是必然趋势,需要多学科交流、协同创新、深度合作才能完成。

猜你喜欢
客观化舌象发文
574例新型冠状病毒肺炎康复者舌象特征分析
基于Citespace的国内肿瘤舌象研究可视化分析(2001-2020年)
中医舌象特征客观化研究领域科学知识图谱与可视化分析
基于Citespace糖尿病舌象研究的文献计量与可视化分析
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
舌象仪临床应用研究的方法学及报告质量评价
民事司法视野下的“期待可能性”内涵探讨
基于光纤微震动传感器的脉象分析诊疗系统
冠心病的脉象研究