动脉粥样硬化易感基因挖掘与生物信息学分析

2018-01-05 04:34王文栋常晓彤杜华阳河北北方学院医学检验学院生物化学教研室河北张家口075000
中国老年学杂志 2017年24期
关键词:染色体硬化检索

王文栋 常晓彤 杜华阳 (河北北方学院医学检验学院生物化学教研室,河北 张家口 075000)

动脉粥样硬化易感基因挖掘与生物信息学分析

王文栋 常晓彤 杜华阳1(河北北方学院医学检验学院生物化学教研室,河北 张家口 075000)

目的挖掘动脉粥样硬化(AS)易感基因,为寻找AS正确的诊断和治疗方法提供线索和数据支撑。方法从PubMed、OMIM和GEO数据库检索AS相关数据,利用SMD在线工具对AS易感基因进行染色体定位,并通过DAVID和STRING10.0软件进行基因功能注释和蛋白互作分析。结果共获得AS易感基因454个,其染色体定位分布不均匀,以1、11、2和4号分布较多,Y染色体多于X染色体上的分布;AS易感基因富集在24个生物学功能注释单元中,其中44个编码蛋白存在互作关系,涉及多种生物学过程和分子功能。结论AS易感基因的控掘与生物信息分析为AS的分子水平机制研究提供了数据平台,为多基因复杂疾病的基因挖掘提供了有效方法。

动脉粥样硬化;易感基因;染色体定位;富集分析;蛋白质互作网络

动脉粥样硬化(AS)也被称为动脉硬化性血管病(ASVD),包括脂质代谢紊乱、血管内皮细胞受损、炎性细胞浸润、斑块破裂和血栓形成等慢性病理过程,是众多心脑血管疾病共同的病理基础〔1~5〕。AS患病早期无明显症状,患者察觉时多因发现其他心脑血管并发症,例如,脑卒中、心脏病等〔4〕。诱发AS的风险因素较多〔5〕,如糖尿病、血脂异常、吸烟、肥胖、维生素B缺乏、PM2.5空气污染等〔6~8〕。研究表明男性AS发病率明显高于女性,且男性发病年龄集中在40~50岁,女性发病年龄则集中在50~70岁〔9〕。AS是由遗传与环境因素共同作用的多基因病,其病理过程复杂,分子水平机制尚不明确。近30年来,人类基因组计划的完成、高通量芯片技术的诞生、生命科学和生物信息学领域的不断更新与完善使人们在分子水平积累了大量的实验数据和研究成果。2000年7月,美国国立生物技术信息中心NCBI首次发布了GEO数据库,它储存了大量的基因表达、分子丰度信息,可上传和储存高通量生物芯片实验数据,是目前最重要的对基因表达数据进行浏览、查询和检索的在线资源〔10〕。目前权威的人类孟德尔遗传在线数据库是持续更新的关于人类基因和遗传紊乱疾病的数据库,为多基因复杂疾病的研究提供了数据支持〔11〕。miRNA水平的基因治疗是探索治疗AS的新途径,但目前主要处于动物试验阶段〔12〕。本研究拟挖掘AS易感基因、在系统和生物组学水平研究其功能及在疾病发生中的作用。

1 材料与方法

1.1数据来源 AS易感基因主要从PubMed、OMIM、GEO数据库中进行检索和挖掘。以“Atherosclerosis AND human”为检索词在PubMed数据库进行检索,获得与AS相关的文献共计86 364条,其中涉及AS相关基因共计209个;利用OMIM数据库进行检索与挖掘,共获得212条AS相关记录,挖掘到189个AS相关基因,并根据OMIM号在NCBI上检索到AS相关基因的Gene ID;在GEO DataSets中以“Atherosclerosis AND human〔organism〕”检索人类有关的AS微阵列实验数据,从GDS5083数据集中下载研究项目编号为GSE43292的芯片数据作为研究对象,利用NCBI提供的“up/down gene”筛选工具,获得与AS相关的差异表达基因69个。

1.2方法 根据AS易感基因一一对应的Gene ID,利用在线分析工具Stanford Microarray Database〔13〕,对AS易感基因进行染色体定位,并作图统计分析。利用DAVID数据库〔14〕采用全新的模糊聚类算法,将AS易感基因列表关联到生物学注释上,进而从统计层面,在数千个关联注释中,找出最显著富集的生物学功能注释,功能相关的基因聚到一个单元,在生物学网络水平研究这些基因群。由于功能相似的基因其编码的蛋白通常存在互作关系,所以利用STRING10.0在线分析工具〔15〕将AS易感基因富集结果所得基因编码蛋白进行互作网络分析。

2 结 果

2.1AS易感基因的挖掘 从PubMed、OMIM、GEO数据库对AS易感基因进行挖掘,经过筛选、统计和汇总,共得到AS易感基因454个。见表1。

2.2AS易感基因的染色体定位 454个AS易感基因染色体定位结果显示见图1,AS易感基因在染色体上的分布较广,但不均匀,其中1号染色体上分布最多,其次为11、2、4号染色体,除此之外,AS易感基因在性染色体上也有分布,在Y染色体上分布的易感基因有RPS4Y1、UTY、KDM5D、USP9Y、DDX3Y、EIF1AY和TXLNGY,而X染色体上分布的易感基因有IL13RA2、TMEM255A和RPS26P11。

表1 AS易感基因

续表1 AS易感基因

2.3AS易感基因的富集分析 利用DAVID在线分析工具将AS易感基因关联到24个注释单元中,Cluster#1 26个包括LPL、GALNT2、HNF1A、LDLR、FADS1、APOC1、FADS3、FADS2、ABCA1、APOA4、ABCG8、APOB、GCKR、APOA1、APOE、LCAT、APOC3、APOA5、LIPG、PCSK9、SORT1、CETP、LIPC、ANGPTL3、PLTP、ANGPTL4;Cluster#2 17个:GALNT2、LPL、LDLR、APOC1、ABCA1、APOA4、APOB、GCKR、APOA1、APOE、LCAT、APOA5、APOC3、LIPG、SORT1、PCSK9、CETP;Cluster#3 18个:GALNT2、LPL、LDLR、APOC1、DOCK7、ABCA1、APOA4、APOB、GCKR、APOA1、APOE、APOA5、APOC3、LIPG、PCSK9、SORT1、CETP、ANGPTL3;Cluster#4 19个:LPL、LDLR、FADS3、FADS2、DOCK7、ABCA1、APOA4、APOB、GCKR、ABCG5、APOA1、APOE、APOC3、APOA5、LIPG、CETP、LIPC、ANGPTL3、LIPC;Cluster#5 14个:LPL、LDLR、FADS1、CRP、FADS2、G6PC2、APOB、GCKR、LCAT、MTNR1B、SORT1、CETP、LIPC、NR1H3;Cluster#6 5个:SLC2A9、GCKR、APOA1、APOA5、APOC3;Cluster#7 4个:ATHS、ESR1、ALOX5、SELE;Cluster#8 4个:NUMB、ABI2、LRRC18、DNAH5;Cluster#9 4个:LPA、KL、PON1、IRS1;Cluster#10 4个:APOA4、APOA1、APOA5、APOC3;Cluster#11 4个:GCKR、HNF1A、APOE、CRP;Cluster#12 3个:ICAM1、CD36、TNF;Cluster#13 3个:LPL、GCKR、CETP;Cluster#14 3个:WDFY4、TNFAIP3、ITGAM;Cluster#15 4个:ACE、TNFSF4、OLR1、ESR1;Cluster#16 4个:HLA-DRB1、HLA-DRB4、CD40、TNFAIP3;Cluster#17 4个:PPARG、CDKN2B、VEGFA、CDKN2A;Cluster#18 2个:LMNA、PPARG;Cluster#19 2个:ABCG8、ABCG5;Cluster#20 2个:TNFRSF11B、LRP5;Cluster#21 2个:CDKN2A、CDKN2B;Cluster#22 2个:ICAM1、ABO;Cluster#23 3个:HMOX1、SERPINA1、FGB;Cluster#24 2个FGB、FGA。主要涉及血脂异常位点、冠状动脉疾病风险位点、心血管疾病标记基因位点和主动脉粥样硬化易感基因位点等。此外,发现有少数AS易感基因是一些非心脑血管疾病的关联基因,例如:WDFY4、TNFAIP3、ITGAM与红斑狼疮有关;HLA-DRB1、HLA-DRB4、CD40、TNFAIP3与风湿性关节炎有关;TNFRSF11B、LRP5与骨质疏松有关;HMOX1、SERPINA1、FGB与慢性肺炎相关。

图1 AS易感基因的染色体定位

2.4AS富集基因编码蛋白的互作关系 利用STRING10.0在线分析工具发现AS富集基因中有44个基因编码的蛋白存在互作关系见图2,其中APOC1、ABCG5、ABCG8、APOA4、APOC3、APOE、PCSK9、APOA1、CETP、LDLR、LPL、APOB、LPA、LCAT、ANGPTL3、LIPG、ABCA1、APOA5、NR1H3、PON1和PLTP蛋白与其他≥5个蛋白存在相互关系,为此蛋白互作网络的中心节点,删除这些节点蛋白后,网络结构涣散。其中APOC1、APOC3;APOA1、APOA4、APOA5;APOB、APOE属于载脂蛋白家族,与脂代谢疾病、高血压、慢性心脏病等密切相关,且APOC1、APOC3、APOE与老年痴呆认知能力下降有关;ABCG5、ABCG8和ABC属于跨膜转运蛋白G家族;ABCA1基因与胆固醇逆转运和高密度脂蛋白生成有关,具有抗AS的作用;PCSK9、CETP、LDLR、LIPG、LPA和LPL调节血浆胆固醇的代谢;ANGPTL3属于血管生成素样蛋白家族,能抑制脂蛋白酶活性从而调节脂蛋白代谢;PON1可以保护低密度脂蛋白,对抗AS形成;PLTP 为磷脂转运蛋白参与高密度脂蛋白的转运与修饰,调控脂蛋白代谢;NR1H3为核受体基因,但功能尚不明确。

图2 富集基因的蛋白-蛋白相互作用

3 讨 论

AS病理过程复杂,常伴有其他心脑血管并发症,受遗传和环境的共同影响,但其涉及致病基因较多,分子水平机制尚不明确,通过生物信息学方法尽可能全面地挖掘到AS易感基因共计454个,为AS发病机制的研究提供了数据平台,富集分析获得的基因可以找到44个互作蛋白,将成为后续研究的重要突破。染色体定位显示,Y上的易感基因明显多于X染色体上的易感基因,锁定这些易感基因有助于解释男女AS发病率及发病年龄的差别。了解AS易感基因在染色体上的定位,有助于进一步进行连锁分析,寻找更多相关基因,确定分子水平作用机制。另外,这种生物信息学方法可用于其他多基因复杂疾病易感基因的挖掘工作中,为复杂疾病的诊断和治疗提供线索和数据支撑。

1Ross R.Atherosclerosis-an inflammatory disease〔J〕.New Engl J Med,1999;340(2):115-26.

2王 蕾.动脉粥样硬化治疗研究新进展〔J〕.现代医药卫生,2013;29(20):3085-8.

3Wang-michelitsch J,Michelitsch T.Misrepair mechanism in the development of atherosclerotic plaques〔J〕.Bibcode,2015;8:49-59.

4Ross R.The pathogenesis of atherosclerosis:a perspective for the 1990s〔J〕.Nature,1993;362(6423):801-9.

5Blankenhorn DH,Hodis HN.Atherosclerosis--reversal with therapy〔J〕.Western J Med,1993;159(2):172-9.

6Mitchel RS,Kumar V,Abbas AK,etal.Robbins basic pathology:with student consult online access〔M〕.8th ed.Philadelphia:Saunders,2007:156-245.

7Gruberg ER,Raymond SA.Beyond cholesterol:vitamin B6,arteriosclerosis and your heart〔M〕.New York:St.Martin's Press,1981:200-65.

8Provost EB,Madhloum N,Int PL,etal.Carotid intima-media thickness,a marker of subclinical atherosclerosis,and particulate air pollution exposure:the meta-analytical evidence〔J〕.PLoS One,2015;10(5):e0127014.

9Flora G,Baker AB,Loewenson RB,etal.A comparative study of cerebral atherosclerosis in males and females〔J〕.Circulation,1968;38:859-69.

10Barrett T,Wilhite SE,Ledoux P,etal.NCBI GEO:archive for functional genomics data sets-update 〔J〕.Nucleic Acids Res,2013;41:D991-5.

11Mckusick VA.Mendelian inheritance in man:a catalog of human genes and genetic disorders baltimore〔M〕.12th ed.Baltimore,Maryland:Johns Hopkins University Press,1998:201-305.

12Rayner KJ,Sheedy FJ,Esau CC,etal.Antagonism of miR-33 in mice promotes reverse cholesterol transport and regression of atherosclerosis〔J〕.J Clin Invest,2011;121:2921-31.

13Demeter J,Beauheim C,Gollub J,etal.The stanford microarray database:implementation of new analysis tools and open source release of software〔J〕.Nucleic Acids Res,2007;35:D766-70.

14Jiao X,Sherman BT,Stephens R,etal.DAVID-WS:a stateful web service to facilitate gene/protein list analysis〔J〕.Bioinformatics,2012;28(13):1805-6.

15Szklarczyk D,Franceschini A.STRING v10:protein-protein interaction networks,integrated over the tree of life〔J〕.Nucleic Acids Res,2015;43:D447-52.

R34

A

1005-9202(2017)24-6071-05;

10.3969/j.issn.1005-9202.2017.24.028

1 河北北方学院基础医学院医学影像学系

常晓彤(1968-),女,教授,硕士,硕士生导师,主要从事脂代谢相关疾病的分子机制及临床应用的研究。

王文栋(1985-),女,讲师,硕士,主要从事动脉粥样硬化易感基因的功能研究。

〔2016-11-17修回〕

(编辑 苑云杰/杜 娟)

猜你喜欢
染色体硬化检索
山东:2025年底硬化路铺到每个自然村
双源CT对心脏周围脂肪组织与冠状动脉粥样硬化的相关性
基于深度学习的颈动脉粥样硬化斑块成分识别
瑞典专利数据库的检索技巧
LN17模具钢预硬化热处理正交试验
在IEEE 数据库中检索的一点经验
一种基于Python的音乐检索方法的研究
多一条X染色体,寿命会更长
为什么男性要有一条X染色体?
能忍的人寿命长