Hsa-miR-10a-5p靶基因预测及生物信息学分析

2019-09-04 12:20陈鸿儒曾怀才
生物信息学 2019年3期
关键词:信息学调控通路

陈鸿儒, 陈 聪, 曾怀才

(南华大学 公共卫生学院预防医学系,湖南 衡阳,421001)

miRNA(microRNA)是一类广泛存在于动植物和某些病毒内,长度为19-25 nt的内源性单链非编码小RNA,序列具有高度保守性[1]。miRNA主要通过与靶基因mRNA的3’端非翻译区(3’UTR)结合,导致翻译抑制或者降解,进而调控靶基因的表达[2]。

has-miR-10a-5p是近年来新发现的miRNA,属于miR-10基因家族,其聚集在染色体17长度为22 bp的位置中,具体基因位点在chr17:48 579 838-48 579 947处。近年国内外研究表明,通过与靶基因相互作用,has-miR-10a-5p作为癌基因在多种肿瘤的发生发展中发挥作用[3-7]。目前研究miR-10a-5p与肿瘤抑制和发展的相关问题越来越多,所以对miR-10a-5p进行靶基因相关生物信息学分析对今后探索miR-10a-5p功能和作用十分必要。相较于实验验证,生物信息学能对靶基因及相关通路进行大量多样高速的预测。本研究运用生物信息学方法预测miR-10a-5p的靶基因,并对其靶基因集合进行功能注释(Gene Ontology, GO )和信号通路富集分析(Kyoto Encyclopedia of Genes and Genome Pathway, KEGG Pathway),为后续对miR-10a-5p 的靶基因鉴定及生物学功能研究提供理论基础和思路。

1 资料与方法

1.1 miR-10a-5p的基本生物学信息

使用在线工具miRbase(http://www.mirbase.org/)查找miR-10a-5p的染色体定位、碱基序列及不同动物的成熟序列。并使用clustalx 2.1软件分析物种保守性。

1.2 miR-10a-5p靶基因的预测分析

使用Pubmed(http://www.ncbi.nlm.nih.gov/pubmed/)查找已有文献报道miR-10a-5p靶基因的相关信息。采用Targetscan7.1(http://www.targetscan.org/vert_71/)、miRDB(http://www. http://mirdb.org/)、 mirDIP(http://ophid.utoronto.ca/mirDIP/index_ confirm.jsp)和DIANA TOOLS(http://diana.imis.athena-innovation.gr/DianaTools/index.php)4个在线靶基因预测工具预测miR-10a-5p的靶基因,并用Venny 2.1 (http://bioinfogp. cnb. csic.es/tools/venny/index.html)绘制4个数据库预测靶基因的韦恩图,取交集用于后续分析。

1.3 miR-10a-5p靶基因的GO功能注释及KEGG富集分析

使用在线工具DAVID(http://david.abcc.ncifcrf.gov/)对交集靶基因进行Gene Ontology功能富集分析(GO分析),细胞组分(cellular component,CC)、分子功能(molecular function,MF)、生物学过程(biological process,BP),用超几何分布检验,以P<0.05为显著性阈值,得到具有统计意义前10个GO注释分析。

用DAVID数据库中KEGG Pathway分析对交集靶基因进行信号通路富集分析,具有统计意义前10个信号通路。

2 结果与分析

2.1 miR-10a-5p的序列保守性分析

使用miRBase数据库检索miR-10a-5p的成熟序列,miR-10a-5p在已知的31个物种中存在成熟序列,并且使用数据库下载了人(hsa)、小鼠(mmu)、大鼠(rno)、斑马鱼(dre)等15个物种的成熟序列(见图1)。利用clustalx 2.1软件,对其序列保守性进行分析,结果表明miR-10a-5p在各物种之间具有高度的保守性的成熟序列为“uacccuguagauccgaauuugug”(见表1)。

表1 不同物种miR-10a-5p的成熟序列Table 1 Mature sequence of miR-10a-5p in different species

图1 不同物种miR-10a-5p的成熟序列Fig.1 Mature sequence of miR-10a-5p in different species

2.2 miR-10a-5p的靶基因预测结果

Pubmed检索文献表明,miR-10a-5p通过在转录后水平调控其靶基因参与了多种疾病的发生发展及预后(见表2)。选用TargetScan、miRDB、mirDIP和DIANA TOOLS 4个在线数据库预测的靶基因个数分别为341、233、660和472,用Venny 2.1对上述结果绘制韦恩图取交集,得到79个预测靶基因的数据集(见表3)。作为后续分析的基因总集合(见图2)。

表2 miR-10a-5p调控的靶基因参与人类疾病Table 2 miR-10a-5p target genes involved in human disease

表3 miR-10a-5p调控的靶基因数据集Table 3 Target gene data sets regulated by miR-10a-5p

图2 miR-10a-5p的预测靶基因个数Fig.2 Predicted number of target genes of miR-10a-5p

2.3 miR-10a-5p预测靶基因的GO功能注释

将4个数据库均能预测到的79个靶基因进行GO分析,发现miR-10a-5p的靶基因主要富集于核质、突触、细胞间粘附链接、核基质、组蛋白甲基转移酶复合物等10个细胞组分(P<0.05,见图3);参与肝脏发育、脂肪组织发育、神经细胞凋亡负调控、RNA聚合酶Ⅱ启动子转录的起始、RNA聚合酶启动子转录的正调控、DNA模板转录等10个生物学过程(P<0.05,见图4);显著富集于染色质结合、转录活性激活、RNA聚合酶Ⅱ远端增强子序列特异性DNA结合、RNA聚合酶Ⅱ转录因子活性配体激活的序列特异性DNA结合等9个分子功能(P<0.05,见图5)。

图3 miR-10a-5p靶基因细胞组分的GO功能分析Fig.3 GO function analysis of cell components of miR-10a-5p target gene

图4 miR-10a-5p靶基因生物学过程的GO功能分析Fig.4 GO function analysis of the biological process of miR-10a-5p target gene

图5 miR-10a-5p靶基因分子功能的GO功能分析Fig.5 GO function analysis of molecular function of miR-10a-5p target gene

2.4 miR-10a-5p预测靶基因的KEGG通路分析

利用DAVID数据库中的工具Functional Annotation对靶基因集合进行生物通路富集分析,其中79个靶基因具有相关的生物通路。以人类全基因组为背景,发现miR-10a-5p的靶基因在cAMP信号通路、TNF信号通路及AMPK信号通路中显著富集(见图6)。

图6 miR-10a-5p靶基因KEGG通路富集分析Fig.6 KEGG pathway enrichment analysis of predicted target of miR-10a-5p

3 讨 论

近年来,与miRNA相关的内容已成为研究的热点之一。越来越多的证据表明,miRNA能够通过调控下游靶基因的表达从而发挥其功能,包括重要的生命活动,如细胞分化、增殖、细胞凋亡以及新陈代谢[9],并在肿瘤的发生发展、侵袭与转移[10],以及治疗、预后[11]等方面都有重要作用。而生物信息学在miRNA靶基因的预测等研究中发挥了重要作用,本研究预测靶基因使用了四种计算方法不同的miRNA靶基因预测软件进行,考虑到miRNA与靶基因结合位点的序列保守性、序列匹配、miRNA 与mRNA 双链结合的热稳定性等因素来预测靶基因,具有高特异性和低假阳性率,将预测的靶基因取交集后作为靶基因集合,因此它作为分析的靶基因集合具有很好的代表性。

本研究中预测得到总共79个miR-10a-5p的靶基因, 靶基因存在细胞的各个组分中,具有染色质结合、转录活性激活、RNA 聚合酶Ⅱ远端增强子序列特异性DNA结合和其它分子功能,并显著富集于肝脏发育、脂肪组织发育、神经细胞凋亡负调控等生物学过程;显著富集于cAMP信号通路、TNF信号通路及AMPK信号通路。大量研究发现,miR-10a-5p在细胞增殖和分化[11-12]过程中起着重要的调控作用,有研究发现,阿兹海默症(AD)中淀粉样蛋白-β或TAU病理诱导的神经元miR-10a-5p的升高[13],推测miR-10a-5p能调控神经元及突触的转录[14]。研究还表明滑膜细胞中miR-10a-5p的下调有助于TBX5控制的关节炎症[15],并起到抑制各种炎性细胞因子的产生的作用。

大量研究表明,miR-10a-5p在多种恶性肿瘤中异常表达。例如,miR-10a-5p在宫颈癌和人胰腺导管腺癌中呈现高表达[3,5]。然而,一些研究发现miR-10a-5p在多种癌细胞中低表达,如胆管癌、肾细胞癌[4,7]。近年来,一些研究证实miR-10a-5p通过调节其靶基因在抑制肿瘤细胞的增殖和转移中起重要作用,例如miR-10a-5p可通过抑制MAPK8IP1的表达,进而促进胃癌转移[6]。在细胞凋亡和其他肿瘤过程中,已经鉴定了miRNA表达的双相模式(上调和下调),因此miR-10a-5p未来或许可以考虑作为肿瘤的早期诊断[16]和预后[17]的分子生物标志物及治疗肿瘤的潜在靶标[18-19]。

4 结 论

本研究采用生物信息学方法对miR-10a-5p的GO功能富集分析和Pathway通路富集分析等数据进行系统的挖掘,结果显示miR-10a-5p在生长发育及肿瘤发生发展过程中的作用不容忽视,且本研究结果与现有对miR-10a-5p调控作用的研究报道基本一致,说明生物信息学分析具有可靠性。这些分析为有关miR-10a-5p在各生物学过程中的作用机制后续研究提供了一定的数据支持和探索思路。但由于预测靶基因过程中仍存在不可避免的假阳性率,因此,由本次实验结果筛选出的靶基因还需进行实验验证,其功能和相关信号通路也有待进一步研究。

猜你喜欢
信息学调控通路
鸡NRF1基因启动子区生物信息学分析
如何调控困意
经济稳中有进 调控托而不举
初论博物馆信息学的形成
顺势而导 灵活调控
Kisspeptin/GPR54信号通路促使性早熟形成的作用观察
中欧医学信息学教学对比研究
SUMO修饰在细胞凋亡中的调控作用
proBDNF-p75NTR通路抑制C6细胞增殖
HGF/c—Met信号转导通路在结直肠癌肝转移中的作用