基于Cytoscape下斑马鱼衰老基因-蛋白质的模块化分析

2019-09-04 12:20蒋林华
生物信息学 2019年3期
关键词:斑马鱼蛋白质节点

李 雷, 蒋林华

(上海理工大学 现代光学系统重点实验室,上海 200093)

过去的20年里,斑马鱼逐渐成为研究人类基因功能的重要模式动物。因为它们的寿命相对较短,但与人类一样,它们仍然会逐渐老化。并且,由于它的生命周期短,适合做生物学实验。此外,它的保守分子的广泛表征细胞生理学使斑马鱼成为揭示老化,疾病和修复的潜在机制的极好模型。了解斑马鱼衰老基因的分子机制,例如氧化蛋白质在肌肉中的积累都至关重要[1-2]。尽管没有现成的斑马鱼衰老基因组,但大多数的性状都需要涉及到一个复杂的分子之间相互作用,因此,衰老也不例外。

最近,有了更多关于斑马鱼神经系统老化的消息,使得对于它的衰老分子机制的研究更加明朗。斑马鱼尤其有可能在老年学研究中具有很大的价值,因为发展 - 精神和基因研究的丰富性已经推动了基本斑马鱼生物学和相关实验技术的广泛特征化。这种小型脊椎动物具有几个独特的特征,为该领域提供许多优势。此外,大多数斑马鱼因组已被测序,并被证明与人类具有高度相似性,具有许多人类基因的直系同源物。一个复杂的哺乳动物样发育基因程序生成了一个整合的神经系统,为此所有的主要脑区都被映射,并赋予这些斑马鱼高级认知功能和社会行为[3]。此外,斑马鱼专用实验程序(获得和丧失功能方法,体内成像技术)和资源(克隆,抗体)的广泛可用性将进一步支持老化。在之前的斑马鱼研究中,衰老一直被认为是微不足道的,因为它们经历了不确定的生长并具有非常强大的再生能力。过去二十年的不断努力,已经开始研究出斑马鱼内潜伏老龄化途径,说明了与其他脊椎动物物种的许多相似之处。它们表现出相同的典型标记和降低的β-半乳糖苷酶表达,并显示出通常类似于人类中已知的年龄相关病理学的衰老表型和骨关节炎[13]。

研究表明,由于斑马鱼复杂和多效的性质,其衰老状态难以用少数特征来表征。越来越明显的是,许多老龄驱动因素相互关联并产生相互影响。不幸的是,到目前为止,对于斑马鱼衰老分子机制的分子相互作用很少,所以高度需要斑马鱼衰老蛋白质分子相互作用交互图。在这种情况下,使用不同的动物模型系统进行精确的遗传或药理学操作确实可以在不同的生理系统和/或功能中鉴别衰老剂。因此,似乎只有将不同模型中的数据组合起来才有助于破译造成老龄化的主要因素。

1 数据来源和分析

数据来源National Center of Biotechnology Information(NCBI)基因表达综合数据库(GEO)数据库(http://www.ncbi.nlm.nih.gov/geo/),GPL1319平台([Zebrafish] Affymetrix Zebrafish Genome Array)应用于表达式阵列。本平台的斑马鱼数据集包含12个样本,下载这些数据(CEL表单)和注释文件以进行进一步分析。由于智人与斑马鱼具有很高的同源性,最后从47 036个斑马鱼基因中,选择了67个与智人具有同源性、具有代表性的斑马鱼衰老相关基因[4-7]。使用SPSS对数据进行标准化处理,然后将获得的67个基因放入NCBI的GEO数据集中。已经发现85.38%的基因被用于功能基因组学研究,因此我们有理由相信这些数据可以作为斑马鱼衰老机制的基因。获得原始数据后,对数据进行归一化,使得GEO数据集中斑马鱼基因与人类基因之间的同源性系数在0到1之间,然后进行单样本T检验方法鉴定Hgs(同源性基因),得出GEO中与人类同源性高的斑马鱼基因。选择置信区间为99%作为截止标准(见表1)。

表1 来自GEO数据库的同源化基因的分析结果Table 1 Analysis of homologous genes from the GEO database

2 同源性基因的功能性富集分析

KEGG(京都基因与基因组百科全书)是基因组破译方面的数据库。它是一个公认的综合性数据库,同时它是一个系统的分析基因功能、基因组信息数据库,它有助于研究者把基因及表达信息作为一个整体网络进行研究,包括各种生物化学途径[5-8]。因此,在这项工作中,我们对Hgs应用了KEGG数据库研究Hgs的富集分析,寻找可能影响斑马鱼衰老发生的生物化学途径。DAVID用于进行KEGG通路富集分析,p值<0.05,基因计数>2。为了进一步了解Hgs的功能,DAVID应用于识别显着失调的KEGG途径。来自所有衰老相关基因的p值<0.05和基因计数> 2获得的途径分别显示在表2中。根据富集结果,显著富集FoxO singaling pathway、ErbB singaling pathway、p53 singaling pathway、Focal adhesion等。其中也不乏一些之前预测像细胞新陈代谢之类的通路,我们有理由相信通过这些蛋白质相互作用,可以得出或者预测之前不曾考虑到的斑马鱼致衰老因素[6]。

3 蛋白质相互作用网络的构建

由于蛋白质很少独立发挥其功能,因此通过研究蛋白质的较大功能群来了解这些蛋白质的相互作用是重要的[9-10]。所以在这项研究中,STRING在线工具被用来分析Hgs的PPIs,其综合得分> 0.15的截止标准。从以前的研究中,大多数获得的PPI网络服从无标度归因[16-18]。同时,网络的节点度被分析并用于获得PPI网络中的中枢蛋白质,选择连接度>35作为中枢节点,并预测可能在斑马鱼的衰老研究进展中占重要比重。STRING工具被用来获得Hgs的PPI关系[11-12]。综合得分> 0.4时,共获得767个PPI关系。在滤除了度数≤5的节点后,我们最终构建了包含78个节点和478个边的网络(见图1)。计算PPI网络各节点的连通度,输出见图2。高连接度>35的这些基因(kita、mapk3、mapk1、ptneb、kras、mtor、jak2b、hrasb、sirt1、myca、pickc3、arf1)被选为影响斑马鱼衰老的重要因素。

表2 同源性基因的KEGG通路分析Table 2 Analysis of the KEGG pathway of homologous genes

图1 通过STRING在线工具获取网络图,并对选定的一些中心基因进行标记Fig.1 Network map obtained through the STRING online tool with some selected central genes marked

图2 PPI网络中各节点的连通度Fig.2 Connectivity of each node in PPI network

4 同源性基因的网络模块分析

由于PPI网络的节点和边缘非常复杂,我们需要使用ClusterONE Cytoscape插件进行富集分析。在运行ClusterONE Cytoscape以披露PPI网络的丰富功能模块之前,设置参数最小尺寸> 5且最小密度<0.05。我们还对模块基因进行了GO(基因本体论)功能富集分析,以分析分子水平上的基因功能。此外,我们还使用DAVID进行最佳富集模块KEGG通路富集分析,同时进行了Kmeans聚类。PPI网络富集是研究和鉴定功能蛋白质的主要方法之一[23]。在这项研究中,有8个重要模块(p值<1×10-3)通过ClusterONE Cytoscape插件进行富集,参数最小> =5,最小密度<0.05。最重要的富集模块A(p=1.0×10-3),模块B(p=9.083×10-5)和模块C(p=1.2×10-3)如图3所示。根据图3,显然模块A可能是最好的模块,因为它有42个节点和487条边,而模块B有10个节点和44条边,模块C有7个节点和21条边[15]。为了进一步研究肿瘤进展过程中的功能变化,我们在模块A中进行了GO功能注释[19-20]。模块A的 GO富集分数分别为18.28。因此,模块A可能是进一步功能分析最合适的模块。模块A中有42个基因(见图3),它们和之前我们所假设的中枢基因不谋而合,所假设的中枢基因也在图一中标注出来。因此模块A可能是进一步功能分析最合适的模块。模块A有42个基因,它们在细胞老化、细胞周期、代谢过程的调节等生物过程功能富集,然后通过KEGG富集分析研究结果。

5 结 果

本项目介绍了斑马鱼这种模式生物衰老机制,涵盖了衰老相关的87个蛋白质之间的767个相互作用。这不仅包含准确预测的PPI,还包含从文献收集以及实验所得的那些分子相互作用。然后进行网络化,找到中枢基因(mapk1、mtor、tp35、kita、pik3cs、myca、sirt1、kras、mapk3、arf1、jak2b),与后面的模块富集得出的重要基因不谋而合。在对斑马鱼衰老过程进行模块A分析的过程中,得出生物调节、生物过程、分子代谢过程等功能富集,说明端粒磨损、细胞老化对斑马鱼衰老过程中起到重要的作用[21-22]。同时,参考López-Otín等人(2013年)描述衰老与生物体的基本功能相关的九个主要参数,并且通常与衰老过程相关,进一步佐证我们的预测。

图3 Hgs的PPI模块化分析中的模块AFig.3 Module A in PPI modular analysis of Hgs

6 讨论与展望

斑马鱼已成为脊椎动物基因功能研究的热门生物。该物种几乎透明的胚胎以及通过基因敲低或过表达加速基因研究的能力已经导致斑马鱼在脊椎动物基因功能的详细研究中的广泛使用,并且越来越多地研究人类遗传疾病[27-29]。但是,为了有效模拟人类遗传疾病,了解斑马鱼基因和基因结构与直系同源人类基因的相关程度很重要。在这项研究中,根据斑马鱼与人类的同源性,从NCBI(https://www.ncbi.nlm.nih.gov/)47 036个斑马鱼基因中,选择了67个具有代表性的斑马鱼衰老相关基因。这些基因大多富含生物过程和生物调节,部分基因富含细胞代谢过程等。

通过分析网络中的功能富集,发现细胞有很多重要的生物过程[24-26]。P53是许多的肿瘤类型起着肿瘤抑制剂的作用,根据生理情况和细胞类型诱导生长停滞或细胞凋亡。作为反式激活因子参与细胞周期调控,通过控制该过程所需的一组基因来负向调节细胞分裂。其中一个激活的基因是细胞周期蛋白依赖性激酶抑制剂。细胞凋亡诱导似乎是通过刺激bax和fas抗原表达或通过抑制Bcl-2表达来介导的。

此外,使用STRING工具获得Hgs的PPI关系,并获得了具有87个节点和767个边缘的网络。在网络中,选择kita、mapk3、mapk1、ptneb、kras、mtor、jak2b、hrasb、sirt1、myca、pickc3、arf1作为集线器节点,因为它们的连通度> 35。最后,我们进行了PPI网络的模块分析。含有42个基因的模块A被证明与斑马鱼衰老密切相关[14-15]。通过GO分析,模块A中的基因在生物调节、生物过程,分子代谢过程等功能富集,说明端粒磨损、细胞老化对斑马鱼衰老过程中起到重要的作用。

7 结 论

作为研究的结果,我们证实斑马鱼衰老机制与FoxO singaling pathway、ErbB singaling pathway、p53 singaling pathway、Focal adhesion、分子代谢过程有关。此外,我们还发现mapk1、mtor、tp35、kita、pik3cs、myca、sirt1、kras、mapk3、arf1,jak2b等基因可能在衰老机制中发挥重要作用,并且它们是预测的源基因。

猜你喜欢
斑马鱼蛋白质节点
CM节点控制在船舶上的应用
蛋白质自由
人工智能与蛋白质结构
小斑马鱼历险记
基于AutoCAD的门窗节点图快速构建
概念格的一种并行构造算法
瓜蒌不同部位对斑马鱼促血管生成及心脏保护作用
油红O染色在斑马鱼体内脂质染色中的应用
抓住人才培养的关键节点
几种石油烃对斑马鱼的急性毒性效应研究