比较基因组分析斯氏假单胞菌遗传多样性及固氮基因岛进化机制

2017-02-27 10:35李向阳汤宏张国辉
江苏农业科学 2017年1期
关键词:多样性

李向阳+汤宏+张国辉

摘要:对5株固氮与11株非固氮斯氏假单胞菌(Pseudomonas stutzeri)基因组开展综合比较分析,从基因组水平上研究斯氏假单胞菌种内遗传多样性及其固氮基因岛进化机制。核心与元基因组分析发现,16个斯氏假单胞菌拥有的独特基因数占元基因数的46.37%;基于平均核苷酸相似度分析,这16个菌株被划分为11种不同的基因组变异型,表明斯氏假单胞菌基因组异质化程度高。固氮基因岛及进化树分析表明,5株固氮菌属于3种不同基因组变异型,它们的固氮基因岛及其侧翼序列保守性好,而且固氮酶基因进化树与菌株谱系进化树呈现高度一致性。据此推测,斯氏假单胞菌祖先可能通过水平基因转移的方式获得固氮基因岛,从而转变为固氮菌,但是在后期进化过程中,绝大部分固氮菌株丢失了固氮基因岛。

关键词:斯氏假单胞菌;固氮基因岛;比较基因组;基因组变异型;多样性

中图分类号: S182 文献标志码: A 文章编号:1002-1302(2017)01-0033-06

斯氏假单胞菌(Pseudomonas stutzeri)属γ变形菌亚门(γ-Proteobacteria)假单胞菌属(Pseudomonas),是革蘭氏阴性菌。它广泛分布于土壤、湖泊和海洋,甚至临床环境中[1-2],是研究细菌反硝化作用机制的主要模式菌株之一,同时也是假单胞菌属中为数不多的具备生物固氮能力的菌种[3-4]。代谢功能多样性是斯氏假单胞菌的典型特征,这些代谢功能使得斯氏假单胞菌在农业生产和环境修复领域具有重要应用价值[3]。例如,斯氏假单胞菌的生物固氮和反硝化代谢作用广泛参与氮元素的地球化学循环;一些斯氏假单胞菌能够降解芳香族化合物(如萘、苯并蒽、咔唑)[5]并参与重(类)金属循环与转化[6]。此外,很多菌株具有自然转化(自然吸收外界DNA)的能力,如自然转化菌株P. stutzeri DSM 10701[7]、P. stutzeri 28a24[8]。

基于16S rRNA 基因及多位点序列分析发现,斯氏假单胞菌在遗传水平上呈现高度异质性[9-10]。因为在分类学上暂时没有发现明确的表型来支持新种的划分,所以研究者暂时采用基因组变异型对这些斯氏假单胞菌进行分类[3]。目前斯氏假单胞菌被划分为多达19种不同的基因组变异型[3,11],如该种的典型菌株P. stutzeri ATCC 17588和固氮菌株P. stutzeri A1501为基因组变异型1的菌株[12-13];P. stutzeri ATCC 14405为基因组变异型2的菌株[14];固氮菌株P. stutzeri NF13为基因组变异型19的菌株[15]。

自2008年中国农业科学院首次完成联合固氮斯氏假单胞菌A1501基因组序列测定以来[13],目前累计已对十几株分离于不同环境的斯氏假单胞菌完成了基因组序列的测定,其中包括5株固氮菌,分别是菌株P. stutzeri A1501、P. stutzeri DSM4166、P. stutzeri B1SMN1、P. stutzeri NF13、P. stutzeri KOS6[13,15-18]。对P. stutzeri A1501菌株的固氮基因岛分析显示,它由49个成簇分布的基因组成。通过与假单胞菌属其他菌株基因组序列比较并结合GC含量分析,推测菌株A1501的固氮基因岛可能通过水平基因转移的方式获得[13]。

虽然众多斯氏假单胞菌完成了基因组测序,但是目前还没有对它们开展多基因组比较的报道。本研究首次对16株斯氏假单胞菌基因组进行综合比较分析,从基因组成水平上分析与解释斯氏假单胞菌显著的遗传多样性;同时通过斯氏假单胞菌种内的5株固氮菌、11株非固氮菌基因组之间的比较来分析固氮基因岛复杂的进化机制。

1 材料与方法

1.1 材料

16株斯氏假单胞菌基因组从美国国家生物技术信息中心(NCBI)基因组数据库下载,包括7株完整基因组(P. stutzeri 28a24、P. stutzeri A 1501、P. stutzeri ATCC 17588、P. stutzeri CCUG 29243、P. stutzeri DSM 10701、P. stutzeri DSM 4166 和P. stutzeri RCH2)和9株草图基因组(P. stutzeri ATCC 14405、P. stutzeri B1SMN1、P. stutzeri KOS6、P. stutzeri MF28、P. stutzeri NF13、P. stutzeri SDM-LAC、P. stutzeri T13、P. stutzeri TS44 和P. stutzeri XLDN-R)。

1.2 方法

1.2.1 核心基因与元基因组分析 利用自编写的Perl脚本从16个斯氏假单胞菌的基因组序列注释文件中分别提取每个基因组的所有基因序列,作为元基因组分析软件PGAP[19]的输入文件;然后在LINUX系统下运行PGAP,依次经蛋白质同源聚类分析和元基因组计算,即可获得元基因组和核心基因组信息。

1.2.2 核心基因序列构建系统谱系进化树 利用16个斯氏假单胞菌的核心基因数据来推导它们之间的谱系进化关系。首先从17个菌株(选取铜绿假单胞菌Pseudomonas aeruginosa POA1为外群菌株)的核心基因中选取894个高度保守基因(蛋白质相似度≥70%,序列比对覆盖度≥90%),确保这些同源蛋白基因在每个基因组中只有1个拷贝,而且每套保守基因的长度都差不多;用ClustalW分别比对每套保守基因的蛋白质序列,然后将这些保守基因比对结果串联成17条氨基酸链,每条分别对应1个基因组;将串联得到的序列文件导入MEGA 5.0[20]软件,选择邻接法来重构进化树,Bootstrap方法重复计算1 000次来评估树的可靠性。

1.2.3 平均核苷酸相似度(ANI)分析及进化树构建 平均核苷酸相似度表示2个菌株在基因组DNA水平上的相似度,一般用软件JSpecies[21]进行计算。JSpecies计算平均核苷酸相似度的主要步骤:(1)将16个基因组的DNA序列导入JSpecies;(2)在JSpecies窗口,根据基因组两两自由组合,共120个组合[C(16,2)],并选择序列比对算法MUMMER(其他参数设置为默认)进行计算。

将JSpecies生成的120个ANI值导入Excel 2007,以 100-ANI%处理方法构建距离矩阵,然后导入MEGA 5.0构建邻接法进化树。

1.2.4 基因组共线性分析 7株完整基因组采用软件MUMMER 3.0[22]进行共线性分析。在Linux环境下运行MUMMER程序,并选取典型菌株P. stutzeri ATCC 17588作为参考基因组。

1.2.5 多基因组及固氮基因岛比较分析 以生物固氮株A1501生物为参考基因组,利用BLASTp 程序(选择默认参数)比对其他15株基因组的蛋白质基因序列,然后用软件CGview[23]对比对结果进行可视化展示。固氮基因岛序列比對采用多基因组比对软件MAUVE[24]进行。另外,通过5株固氮斯氏假单胞菌的固氮酶编码基因nifHDK比对NCBI蛋白质数据库,获取其他相关菌株的nifHDK蛋白质基因序列,按照“1.2.2”节建树类似方法,构建固氮酶基因进化树。

2 结果与分析

2.1 16株斯氏假单胞菌基因组特征

16株斯氏假单胞菌分离于多种不同的环境,表明它们具有广泛的环境适应性。与假单胞菌属其他菌株相比,斯氏假单胞菌基因组较小,其长度介于4.17~5.32 Mbp之间,GC含量为60.5%~64.4%(表1)。用MUMMER3.0软件分析种内菌株基因组之间的共线性,由图1可知,P. stutzeriATCC17588与同一基因组变异型菌株A1501、DSM 4166及菌株RCH2之间的共线性非常保守;除几个大片段区域的倒位外,P. stutzeri ATCC 17588与基因组变异型3菌株CCCUG 29243的整体共线性较好;但是,菌株ATCC 17588与2个自然转化菌株(P. stutzeri DSM 10701和28a24)的共线性程度非常低。

2.2 核心与元基因组分析

核心和元基因组经常被用来评估一个种内菌株之间的多样性[25],一个种的核心基因定义为所有菌株共同拥有的基因,也就是基本的遗传物质用来维持这个种的特征。元基因组指的是所有基因,主要用来反映这个种容纳遗传物质的能力。分析结果表明,16个斯氏假单胞菌元基因组大小为 10 822 个同源蛋白基因,在10 822个同源蛋白基因中,所有16个菌株的独特同源蛋白基因总和为5 018个(图2),约为元基因组数的46.37%,说明斯氏假单胞菌通过高频率的水平基因转移获取外源基因。核心基因数为2 157个同源蛋白基因(图2),占其基因组大小的42.27%~56.54%,表明斯氏假单胞菌株只需要其50%左右的基因来维持种的基本特征。上述这些特征正好解释了斯氏假单胞菌的表型及代谢多样性,在一定程度上赋予它们适应周围环境的能力。

2.3 平均核苷酸相似度分析斯氏假单胞菌多样性

与16S rRNA基因进化树相比较,核心基因进化树具有更高的分辨率[26]。如图3-A所示,基于894个核心基因构建的进化树能够清晰地区分16个斯氏假单胞菌之间的进化关系。基于120个ANI值构建100-ANI%双向矩阵,然后采用MEGA构建得到进化树,如图3-B所示,可见ANI矩阵进化树与核心基因进化树之间的拓扑结构非常相似。以上结果相互验证了2种方法推导得到的进化树结果的可靠性。

ANI被认为是一种用来比较菌株之间进化距离的非常可靠的方法,2个细菌基因组之间的ANI值为95%,相当于它们之间DNA-DNA杂交值为70%,因此ANI≥95%被作为判断细菌种的阈值[21,27]。由图3-B可知,菌株ATCC 17588、A1501、DSM 4166、B1SMN1、T13和XLDN-R紧密聚集在一起,它们两两之间的ANI值均大于95%,因此被归类为基因组变异型1;其他10个菌株两两之间的ANI值均小于95%的临界值,因此分别代表基因组突变型2、3、8、19和其他未知的6种。综上所述,16个菌株可以被划分为11个基因组变异型;同时ANI分析结果显示,120个ANI值介于84.51%~98.37%之间,绝大多数ANI值远远低于95%,说明斯氏假单胞菌基因组之间存在显著的遗传多样性。

2.4 固氮基因岛进化分析

从图4-A中可以看出,固氮基因岛存在于所有5株固氮斯氏假单胞菌(A1501、B1SMN1、DSM 4166、KOS6和NF13)中, 但是在其他11株非固氮斯氏假单胞菌基因组中缺失,并且固氮基因岛对应的侧翼序列在16个基因组中保守性较好。5株菌的固氮基因岛序列比对分析结果显示,它们整体上的组成类似,并且固氮相关基因序列相似度高(图4-B)。此外还发现,基因组变异型1的3个菌株(A1501、B1SMN1、DSM 4166)的固氮基因岛在组成与排布上几乎完全相同;属于基因组变异型19的NF13菌株,其固氮基因岛与4株固氮菌的差异最大。为了进一步分析固氮基因岛的进化机制,利用5株固氮斯氏假单胞菌及其他相关固氮菌的固氮酶编码基因nifHDK构建进化树。如图5所示,固氮斯氏假单胞菌在nifHDK基因进化树和斯氏假单胞菌谱系进化树(图3-A、图3-B)中的位置关系高度一致。

3 结论与讨论

本研究主要从基因组水平上对斯氏假单胞菌高度的遗传多样性以及固氮基因岛的进化机制进行了分析。斯氏假单胞菌在进化上呈现高度的遗传多样性是该种研究的主要热点之一。之前的研究主要借助16S rRNA基因或者多个看家基因来解析该种群的多样性关系[28-32]。根据相关研究,斯氏假单

胞菌被分为19个基因组突变型,并且更多的基因组突变型还在不断被发现。本研究首次利用已测序的16个斯氏假单胞菌基因组序列,从基因组内容(基因)、结构(共线性)及核苷酸(ANI)水平上分析了斯氏假单胞菌种内多样性。结果显示:(1)绝大多数斯氏假单胞菌两两基因组之间的ANI值都小于95%,16个菌株可以划分为11种不同的基因组变异型;(2)独特基因占整个元基因组数量的46.37%;(3)部分菌株基因组之间的共线性程度非常低(如DSM 10701vs ATCC 17588和28a24vs ATCC 17588)。上述现象正好解释了斯氏假单胞菌种内高度的遗传多样性(异质性)以及多样的代谢表型。在分类学上,ANI被认为很有可能替代DNA-DNA杂交法,作为一种衡量菌株之间遗传关系的非常可靠的方法。本研究根据ANI分析结果推测,斯氏假单胞菌很可能将被划分为多个亲缘关系非常密切的种。

生物固氮菌通过固氮酶及其他相关基因的作用下,将大气中的氮气转变成生物可利用的铵根离子(NH4+),使其在氮元素的地球化学循环和农业生产上具有重要应用价值[33]。虽然生物固氮菌广泛分布于原核生物界,但是主要零星地分布于变形菌门(Proteobacteria)、厚壁菌門(Firmicutes)、蓝藻门(Cyanobacteria)、放线菌门(Actinobacteria)、绿藻门(Chlorobi)、广古菌门(Euryarchaeota)等[34-35]。同样,本研究涉及的5株固氮斯氏假单胞菌也是呈零散状分布于该种的谱系进化树分支中。核心基因进化树分析显示,在进化时间上,非固氮斯氏假单胞菌(MF28、28a24、SDM-LAC、DSM10701和TS44)的起源早于固氮斯氏假单胞菌(A1501、B1SMN1、DSM 4166、KOS6和NF13),因此推测斯氏假单胞菌的祖先不具有固氮基因岛,而是在后来进化的过程中才获得了固氮基因岛[36]。5株固氮斯氏假单胞菌的固氮基因岛组成相似,蛋白质编码基因序列相似度高,并且它们在nifHDK基因进化树和该种谱系进化树中的位置关系高度一致[37],表明固氮基因岛很可能通过垂直遗传传递给子代,同时,ATCC1788、T13、XLDN-R、ATCC1405和CCUG29243在长期的进化过程中丢失了固氮基因岛[36]。另外,固氮基因岛的GC含量明显高于其基因组的平均GC含量,因此推测斯氏假单胞菌固氮基因岛通过近期水平基因转移获得。综上所述,在斯氏假单胞菌中,固氮基因岛的发生与转移是一个相当复杂的过程。

参考文献:

[1]Sikorski J,Mhle M,Wackernagel W. Identification of complex composition,strong strain diversity and directional selection in local Pseudomonas stutzeri populations from marine sediment and soils[J]. Environmental Microbiology,2002,4(8):465-476.

[2]Scotta C,Mulet M,Sanchez D,et al. Identification and genomovar assignation of clinical strains of Pseudomonas stutzeri[J]. European Journal of Clinical Microbiology & Infectious Diseases,2012,31(9):2133-2139.

[3]Lalucat J,Bennasar A,Bosch R,et al. Biology of Pseudomonas stutzeri[J]. Microbiology and Molecular Biology Reviews,2006,70(2):510-547.

[4]Desnoues N,Lin M,Guo X W,et al. Nitrogen fixation genetics and regulation in a Pseudomonas stutzeri strain associated with rice[J]. Microbiology-SGM,2003,149(8):2251-2262.

[5]Moscoso F,Deive F J,Longo M A,et al. Insights into polyaromatic hydrocarbon biodegradation by Pseudomonas stutzeri CECT 930:operation at bioreactor scale and metabolic pathways[J]. International Journal of Environmental Science and Technology,2015,12(4):1243-1252.

[6]Li X Y,Gong J,Hu Y,et al. Genome sequence of the moderately halotolerant,arsenite-oxidizing bacterium Pseudomonas stutzeri TS44[J]. Journal of Bacteriology,2012,194(16):4473-4474.

[7]Busquets A,Pen″a A,Gomila M,et al. Genome sequence of pseudomonas stutzeri strain JM300 (DSM 10701),a soil isolate and model organism for natural transformation[J]. Journal of Bacteriology,2012,194(19):5477-5478.

[8]Sikorski J,Teschner N,Wackernagel A W. Highly different levels of natural transformation are associated with genomic subgroups within a local population of Pseudomonas stutzeri from soil[J]. Applied and Environmental Microbiology,2002,68(2):865-873.

[9]Rius N,Fuste M C,Guasp C,et al. Clonal population structure of Pseudomonas stutzeri,a species with exceptional genetic diversity[J]. Journal of Bacteriology,2001,183(2):736-744.

[10]Cladera A M,Bennasar A M,Lalucat J,et al. Comparative genetic diversity of Pseudomonas stutzeri genomovars,clonal structure,and phylogeny of the species[J]. Journal of Bacteriology,2004,186(16):5239-5248.

[11]Mulet M,Gomila M,Gruffaz C A,et al. Phylogenetic analysis and siderotyping as useful tools in the taxonomy of Pseudomonas stutzeri:description of a novel genomovar[J]. International Journal of Systematic and Evolutionary Microbiology,2008,58(10):2309-2315.

[12]Chen M,Yan Y L,Zhang W,et al. Complete genome sequence of the type strain Pseudomonas stutzeri CGMCC 1.1803[J]. Journal of Bacteriology,2011,193(21):6095.

[13]Yan Y L,Yang J,Dou Y E,et al. Nitrogen fixation island and rhizosphere competence traits in the genome of root-associated Pseudomonas stutzeri A1501[J]. Proceedings of the National Academy of Sciences of the United States of America,2008,105(21):7564-7569.

[14]Pena A,Busquets A,Gomila M,et al. Draft genome of Pseudomonas stutzeri strain ZoBell (CCUG 16156),a marine isolate and model organism for denitrification studies[J]. Journal of Bacteriology,2012,194(5):1277-1278.

[15]Pea A,Busquets A,Gomila M,et al. Draft genome of Pseudomonas stutzeri strain NF13,a nitrogen fixer isolated from the Galapagos rift hydrothermal vent[J]. Genome Announcements,2013,1(2):e00113.

[16]Busquets A,Pea A,Gomila M,et al. Draft genome sequence of Pseudomonas stutzeri strain B1SMN1,a nitrogen-fixing and naphthalene-degrading strain isolated from wastewater[J]. Genome Announcement,2013,1(4):e00584.

[17]Grigoryeva T V,Laikov A V,Naumova R P,et al. Draft genome of the nitrogen-fixing bacterium Pseudomonas stutzeri strain KOS6 isolated from industrial hydrocarbon sludge[J]. Genome Announc,2013,1(1):e00072.

[18]Yu H Y,Yuan M L,Lu W,et al. Complete genome sequence of the nitrogen-fixing and rhizosphere-associated bacterium Pseudomonas stutzeri strain DSM4166[J]. Journal of Bacteriology,2011,193(13):3422-3423.

[19]Zhao Y,Wu J,Yang J,et al. PGAP:pan-genomes analysis pipeline[J]. Bioinformatics,2012,28(3):416-418.

[20]Tamura K,Peterson D,Peterson N,et al. MEGA5:molecular evolutionary genetics analysis using maximum likelihood,evolutionary distance,and maximum parsimony methods[J]. Molecular Biology and Evolution,2011,28(10):2731-2739.

[21]Konstantinidis T K,Tiedje J M. Genomic insights that advance the species definition for prokaryotes[J]. Proceedings of the National Academy of Sciences of the United States of America,2005,102(7):2567-2572.

[22]Kurtz S,Phillippy A,Delcher A L,et al. Versatile and open software for comparing large genomes[J]. Genome Biology,2004,5(2):R12.

[23]Grant J R,Arantes A S,Stothard P. Comparing thousands of circular genomes using the CGView Comparison Tool[J]. BMC Genomics,2012(13):202.

[24]Darling,A C E,Mau B,Blattner F R,et al. Mauve:multiple alignment of conserved genomic sequence with rearrangements[J]. Genome Research,2004,14(7):1394-1403.

[25]Vernikos G,Medini D,Riley D R,et al. Ten years of pan-genome analyses[J]. Current Opinion in Microbiology,2015,23:148-154.

[26]Li X Y,Hu Y,Gong J,et al. Comparative genome characterization of Achromobacter members reveals potential genetic determinants facilitating the adaptation to a pathogenic lifestyle[J]. Applied Microbiology and Biotechnology,2013,97(14):6413-6425.

[27]Richter M,Rosselló-Móra R. Shifting the genomic gold standard for the prokaryotic species definition[J]. Proceedings of the National Academy of Sciences of the United States of America,2009,106(45):19126-19131.

[28]Zhang F,She Y H,Banat I M,et al. Genomovar assignment of Pseudomonas stutzeri populations inhabiting produced oil reservoirs[J]. MicrobiologyOpen,2014,3(4):446-456.

[29]Rossello R,Garcia-Valdes E,Lalucat J,et al. Genotypic and phenotypic diversity of Pseudomonas stutzeri[J]. Systematic and Applied Microbiology,1991,14(2):150-157.

[30]Scotta C,Gomila M,Mulet M,et al. Whole-Cell MALDI-TOF mass spectrometry and multilocus sequence analysis in the discrimination of Pseudomonas stutzeri populations:three novel genomovars[J]. Microbial Ecology,2013,66(3):522-532.

[31]Sikorski J,Lalucat J,Wackernagel W. Genomovars 11 to 18 of Pseudomonas stutzeri,identified among isolates from soil and marine sediment[J]. International Journal of Systematic and Evolutionary Microbiology,2005,55(5):1767-1770.

[32]Bennasar A,Rossellómora R,Lalucat J,et al. 16S rRNA gene sequence analysis relative to genomovars of Pseudomonas stutzeri and proposal of Pseudomonas balearica sp. nov.[J]. International Journal of Systematic Bacteriology,1996,46(1):200-205.

[33]Canfield D E,Glazer A N,Falkowski P G. The evolution and future of earths nitrogen cycle[J]. Science,2010,330(6001):192-196.

[34]Santos P C D,Zhong F,Mason S W,et al. Distribution of nitrogen fixation and nitrogenase-like sequences amongst microbial genomes[J]. BMC Genomics,2012,13(1):162.

[35]Gaby J C,Buckley D H. A global census of nitrogenase diversity[J]. Environmental Microbiology,2011,13(7):1790-1799.

[36]Xie J B,Du Z L,Bai L Q,et al. Comparative genomic analysis of N2-fixing and non-N2-fixing Paenibacillus spp.:organization,evolution and expression of the nitrogen fixation genes[J]. PLoS Genetics,2014,10(3):119-123.

[37]Hartmann L S,Barnum S R. Inferring the evolutionary history of Mo-dependent nitrogen fixation from phylogenetic studies of nifK and nifDK[J]. Journal of Molecular Evolution,2010,71(1):70-85.王 婧. 荷花MADS-box基因的克隆及表達分析[J]. 江苏农业科学,2017,45(1):39-42.

猜你喜欢
多样性
浅析阿拉伯语初级阶段听力教学材料的选择
利用网络教学多样性 开展有效教学
海洋微生物次生代谢的生物合成机制
舞蹈表演的表现形式多样性研究