基于2531例宏基因二代测序结果分析惠普尔养障体

2024-01-08 10:12汪单兰鲁小慧谭妮苏梦婷龚羽婷何贵
岭南急诊医学杂志 2023年6期
关键词:进化树惠普基因组

汪单兰 鲁小慧 谭妮 苏梦婷 龚羽婷 何贵*

惠普尔病是一种罕见的传染病,可表现为腹痛、腹泻、体重减轻、关节炎等多系统非特异性症状,基础免疫低下或缺陷通常会导致更复杂的临床表现[1-2]。惠普尔养障体(Tropheryma whipplei)是细胞内寄生菌,基因组大小约0.9Mbp;为惠普尔病的病原体,可表现出临床症状,也可表现为无症状携带者[1,3]。常规的细菌培养、免疫组织化学、PCR 检测方法不易检出,很难诊断这种感染。由于感染症状的非特异性,该细菌在鉴别诊断中很常见。宏基因二代测序技术(Metagenomic nextgeneration Sequencing,mNGS)经过近10 年的发展,在临床检验医学中逐渐被认可。相较于常规的病原体检测方法,mNGS 检测具有耗时短、能够同时检测多种病原体、灵敏度高、特异性好等特点[4]。目前,采用mNGS 技术检测惠普尔养障体的文献报道并不多。

1 临床资料

1.1 一般资料回顾性分析2020 年9 月-2023 年6 月期间在本院进行mNGS 检测的样本,共计2531例。样本采集遵循无菌操作原则。检测对象年龄范围为1-100 岁,平均值为(50.73±20.89)岁。患者的年龄、性别和样本类型等基本信息从朗伽系统获取。本研究遵循《赫尔辛基宣言》中的伦理原则,经中山大学孙逸仙纪念医院医学伦理委员会批准(SYSKY-2023-806-01)。

1.2 方法(1)宏基因二代测序技术 样本类型包括肺泡灌洗液、痰液、外周血、脑脊液、胸腹水和组织等。不同类型样本的前处理方法不完全相同,样本前处理后提取核酸。通过质控的核酸再片段化、pre-PCR 和PCR 扩增建库。文库质控后,再pooling 文库和上机测序。二代测序使用的平台为illumina NextSeq 550,采用单端测序方法,读长75nt 或40nt。(2)宏基因生信分析 测序下机的fastq数据,过滤低质量序列后,使用Burrows-Wheeler 工具与人类参考基因组(hg19)比对,提取未比对上hg19 的序列。将去除宿主序列的数据,通过宏基因组数据库进行微生物分类注释。(3)系统发育树分析mNGS 是全基因测序技术,由mNGS 测序数据分析进化亲缘关系时,选用了基于单核苷酸多态性(SNP)的方法构建系统发育树。首先从fastq数据中提取惠普尔养障体序列,然后用megahit v1.2.9[5]将惠普尔养障体序列拼接成contigs。构建系统发育树的另外19 株惠普尔养障体基因组序列从NCBI 下载[6]。然后,用snippy v4.4.0 建索引、比对和call SNP 分析,最后用FastTree v2.1.11[7]构建系统发育树。

1.3 统计方法分类变量用百分比表示。服从正态分布的连续变量用(±s)表示。采用t检验或Pearson 检验方法进行比较分析。P<0.05 表示差异具有显著统计学意义。

2 结 果

在2531 例mNGS 样本中,共检测出18 例惠普尔养障体,结果如图1-A 所示,阳性检测率为0.71%。其中,呼吸系统来源的mNGS 样本例数为1090 例,惠普尔养障体阳性检测率为1.55%(17 例/1090 例),与文献报道的阳性检测率相近[8]。图1-A 中,总reads 指mNGS 测序检测到的惠普尔养障体序列数;reads 百分数指惠普尔养障体序列数与所测到的细菌或属总序列数的百分数。t检验比较分析惠普尔养障体阴性与阳性患者的年龄有无差异,P值为0.52,无显著差异,见图1-B 所示。

图1 mNGS 对惠普尔养障体的检测结果

Pearson 检验比较分析惠普尔养障体阴性与阳性患者的性别有无差异,计算得χ2为7.57,P值<0.05,差异显著,表示女性是惠普尔养障体的易感人群,数据见表1。将mNGS 样本类型分为呼吸系统来源和其他来源两大类。其中,呼吸系统来源样本类型包括肺泡灌洗液、肺组织和痰液,其他来源样本类型包括外周血、脑脊液、胸腹水等。比较分析惠普尔养障体阴性与阳性结果的样本类型有无差异,经Pearson 检验计算得出χ2为19.51,P值<0.05,差异显著,表示惠普尔养障体在呼吸系统易感,数据见表2。表1 和表2 中,小括号内的数值为理论频数。

表1 惠普尔养障体感染与性别的关系

表2 惠普尔养障体感染与样本类型的关系

由20 株惠普尔养障体(基因组信息[9]见表3)的基因组序列构建基于SNP 的进化树分析。其中1 株为本科室mNGS 检出的惠普尔养障体,命名为Guangzhou1;另外19 株基因组序列从NCBI 下载。构建进化树序列比对时,选用了基因组完整的Twist 作为参考基因组。构建成的系统发育树如图2 所示,包含3 个主要分支,来自中国广州的Guangzhou1 和来自法国的2 株Slows、Pneumo30 位于系统发育树的同一个子段内,与法国来源的这2株菌亲缘关系更近。有文献报道深圳来源的惠普尔养障体与来自德国的TW08/27 亲缘关系更近[9];这提示,惠普尔养障体进化亲缘关系与地理起源关系不显著。

表3 株普尔养障体基因组信息

图2 株普尔养障体进化树分析

3 讨 论

惠普尔养障体属于放线菌目纤维素单胞菌科养障体属,是细胞内寄生菌,难以培养检出。该细菌扩增复制速度非常慢。在2000 年-2020 年期间,文献中关于该菌的检测方法主要为PCR 检测、免疫组织化学;样本来源于消化系统、心脏、关节、脑等组织,以消化系统为主。近5 年开始出现使用mNGS 检测惠普尔养障体的文献报道。

在2023 年7 月3 日以“whipplei mNGS”、“whipplei Metagenomic”为关键词在pubmed 检索出15 篇文献,以“惠普尔宏基因”为关键词在知网检索出8 篇文献。其中,以呼吸系统样本为主。我们统计显示惠普尔养障体在呼吸系统的检出率高于其他类型样本。由于消化道标本存在污染其他样本的高风险,临床mNGS 不建议用于检测粪便、肛拭子等消化道样本。该文章中,消化系统来源的样本少于10 例,故无法统计消化系统的阳性检出率情况。

进化树分析可用于研究菌株之间的系统发育关系,也可以在疾病爆发期间识别病原体的来源。在这项研究中,我们报道了一个Guangzhou1的基因组序列,它是使用宏基因组测序数据组装而成。另外19 株惠普尔养障体基因组数据从NCBI 下载。我们对这20 株惠普尔养障体的核酸序列进行比对、提取单核苷酸多态性信息后,再构建系统发育树。研究确定了菌株之间的系统发育关系。并发现,即使是来源于不同地理区域的惠普尔养障体也有密切的发育关系,菌株与其地理起源之间没有相关性,这与文献报道一致[9]。

总之,我们使用宏基因组测序技术(mNGS),回顾性分析难以培养检出的惠普尔养障体的阳性率和检出率高的好发部位。此外,从中国广州获得一个惠普尔养障体基因组组装contigs 序列,并采用进化树分析系统发育关系。因此,我们认为mNGS 技术有助于检测和分析难以培养检出的微生物。

猜你喜欢
进化树惠普基因组
基于心理旋转的小学生物进化树教学实验报告
牛参考基因组中发现被忽视基因
常见的进化树错误概念及其辨析*
艾草白粉病的病原菌鉴定
值得安利 ZUKZ2 Pro
惠普增加裁员5%
惠普推出全新系列激光打印机
层次聚类在进化树构建中的应用
基因组DNA甲基化及组蛋白甲基化
有趣的植物基因组