秋茄WRKY基因家族的生物信息学分析

2022-07-29 07:03丁祥青胡敏杰赖兴凯乐易迅刘仲健邹双全
江苏农业科学 2022年14期
关键词:秋茄锌指基序

丁祥青, 胡敏杰, 向 双, 赖兴凯, 乐易迅, 刘仲健, 邹双全

(1.福建农林大学园林学院,福建福州,350002; 2.福建师范大学地理科学学院,福建福州 350007;3.福建农林大学林学院,福建福州 350002; 4.泉州湾河口湿地自然保护区管理处,福建泉州 362000)

WRKY 转录因子是植物中所特有的基因家族,也是植物中最大的转录因子家族之一,在植物生长发育、抵御生物胁迫和非生物胁迫中起着至关重要的作用。在结构方面,WRKY转录因子的结构域有一段约60个氨基酸构成的高度保守的区域。所有已知的WRKY蛋白都含有1个或2个WRKY结构域。根据WRKY 结构域的数量和锌指结构的特征可对WRKY蛋白进行分类:含有2个WRKY结构域的WRKY蛋白属于Ⅰ组,含有1个WRKY结构域且锌指结构为CH(CCHH)的蛋白属于Ⅱ组,而含有1个WRKY结构域且锌指结构为CHC(CCHC)的蛋白属于Ⅲ组。在功能方面,WRKY结构域与目标基因的启动子中的W-box 顺式作用元件[共有序列:(T)(T)TGAC(C/T)]结合将会对调控有积极或消极的作用。研究表明,非生物胁迫会诱导某些WRKY转录因子的大量表达,从而提高植物对非生物胁迫的耐受性。如的过度表达不仅增强了水稻的抗病性还提高了耐盐性和耐旱性;或的过表达会增加拟南芥的耐盐性;大豆可以抑制基因的表达,并通过正向调控介导途径,实现对盐胁迫的响应;番茄基因能够正调控抗逆性相关基因,显著增强番茄的耐盐性。

秋茄()隶属红树科(Rhizophoraceae)秋茄属(),属于典型的非泌盐红树植物,是我国境内天然分布最广和红树林重建和修复的主要造林树种。秋茄多生长在浅海和河流入海口冲积形成的盐滩上,生长环境恶劣,生存压力使其不断进化以提高其抗逆境能力。秋茄是红树植物中最耐寒的树种,也是红树植物中抗逆性最好的树种之一,蕴含着丰富的抗逆基因资源。秋茄是否有其特殊的耐盐与抗逆机制,基因家族如何发挥重要作用尚不清楚。尽管基因家族已经在许多植物中被广泛的研究,然而到目前为止,没有秋茄基因结构和功能方面的研究报道。本研究应用生物信息学方法挖掘秋茄全基因组WKRY转录因子并对其进行分析,以期为秋茄潜在功能研究奠定基础,为解析基因在秋茄特殊的耐盐与抗逆机制中的作用提供参考。

1 材料与方法

1.1 KcWRKY转录因子的鉴定

秋茄基因组由笔者所在课题组测序所得。在Pfam 数据库(http://pfam.xfam.org/)中下载WRKY 转录因子家族的隐马尔科夫模型(PF03106)。利用HMMER 3.0软件(http://www.hmmer.org)的hmmsearch 命令和结构域模型对秋茄基因组pep文件进行搜索,从搜索结果中筛选基因结构域E-value<0.001的基因共71个,将这初步鉴定的秋茄WRKY 转录因子家族成员提交NCBI上的Batch CD-Search (https://www.ncbi.nlm.nih.gov/cdd)网站进行结构域分析,确认WRKY结构域准确后,所得基因即为后续要分析的秋茄WRKY转录因子家族成员。将它们重新命名为~。

1.2 基本特征分析

利用Expasy(https://web.expasy.org/compute_pi/)网站预测家族成员的等电点、相对分子质量、氨基酸长度等性质;通过http://www.csbio.sjtu.edu.cn/bioinf/euk-multi-2/网络预测家族成员在细胞中的位置分布;通过SignalP(http://www.cbs.dtu.dk/services/SignalP-4.1/)预测信号肽。

1.3 KcWRKY基因家族成员多序列对比和系统发育分析

从TAIR(http://www.arabidopsis.org/)网站下载拟南芥WRKY蛋白序列,利用 MEGA 7 软件采用clustalW方法对拟南芥和秋茄的基因家族成员进行多序列比对分析,比对过程选择默认参数,并通过保守序列构建系统发育树,采用遗传距离算法中的邻接法(neighbor-joining,NJ)算法,校验参数Bootstrap设置为重复1 000次。得到系统进化树后,再利用 Figtree 软件对聚类后的进化树进行修饰和标注。

1.4 KcWRKY蛋白保守基序、基因结构和染色体定位分析

使用MEME(http://meme-suite.org/tools/meme)对71个秋茄WRKY蛋白进行保守基序预测,允许保守结构域重复出现,保守性基序的数量限制为10,分别命名为基序1~基序10。利用 Tbtools工具绘制KcWRKY蛋白保守基序、基因结构和基因染色体定位图。

1.5 蛋白互作网络和启动子顺式作用元件分析

将秋茄WRKY蛋白作为研究对象,选定模式植物拟南芥作为物种参数,在 STRING( https://www.string-db.org/) 网站进行蛋白互作网络分析。

提取基因蛋白质编码区(CDS)序列上游 2 000 bp 区段,提交到PlantCare网站进行顺式作用元件预测(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/),筛选其中的激素响应元件、抗逆元件进行分析,Tbtools工具绘图。

1.6 KcWRKY基因的表达模式分析

利用转录组测序获得秋茄不同部位包括花、茎、叶、果实以及果实不同发育时期的表达量数据,利用 Tbtools 工具绘制表达热图。

2 结果与分析

2.1 KcWRKY转录因子的鉴定

在秋茄基因组数据中共鉴定出71个基因,重新命名为~(表1)。KcWRKY蛋白氨基酸长度范围为61()~726()aa,分子量范围为7.05()~78.60()ku,等电点范围为4.46()~10.26(),除了定位于细胞核和细胞质,其余70个KcWRKY转录因子均定位于细胞核。所有基因均无信号肽产生。

表1 KcWRKY转录因子理化性质分析

表1(续)

表1(续)

2.2 KcWRKY转录因子保守结构域分析

利用ClustalW对KcWRKY蛋白进行保守结构域分析,同时根据WRKY 结构域的数量和锌指结构的特征对WRKY蛋白进行分类(图1)。在Ⅰ组蛋白的保守序列中,除了(Ⅰ组中靠近C端的结构域)含有WRKYGEK和含有WRK七肽缺失序列外其余基因均为保守的WRKYGQK型的七肽;除锌指结构变异为HXN和缺失锌指结构外,其余均为CH型。此外,Ⅰ组中的只有1个WRKY结构域,在拟南芥中也出现过类似情况,但是在拟南芥中出现的是N端WRKY结构域缺失而秋茄中缺失出现在C端。在Ⅱ组蛋白的保守序列中,除了和结构域中的七肽部分缺失,的七肽序列是WRKYGKK外,其余基因均为保守的WRKYGQK型的七肽;锌指结构除了、、缺失和缺失HNH外,其余均为保守的 CH型。Ⅲ组蛋白均含有典型的WRKYGQK七肽和CHC型锌指结构。总体上秋茄WRKY成员的WRKYGQK七肽和锌指结构都很保守,少量成员结构域变异的原因可能是在进化过程中基因突变所导致的。由于七肽序列和锌指基序都是WRKYTFs与W-box的高结合亲和力所必需的,它们的缺失可能会导致其功能的丧失。

2.3 KcWRKY转录因子系统进化分析

通过对拟南芥基因()和秋茄()基因结构域进行多序列比对,构建了它们共同的系统发育树(图2)。根据拟南芥基因的划分情况将进化树分为三大类,Ⅰ组包含19个基因,Ⅱ组包含45个基因(其中Ⅱa 2个、Ⅱb 7个、Ⅱc 18个、Ⅱd 10个、Ⅱe 8个),Ⅲ组包含7个基因。由进化树可以看出,秋茄和拟南芥的基因在各个分支中均匀分布,表明他们具有相似的进化方式;N 端和 C 端 WRKY 结构域聚集在不同的进化枝中,这可能反映了2个结构域的平行进化;Ⅱa和Ⅱb蛋白属于同一分支、Ⅱd和Ⅱe蛋白属于同一分支,表明它们之间的进化关系较近。

2.4 KcWRKY转录因子保守基序和基因结构分析

通过对基因的保守基序进行分析(图3、图4)发现同组的家族基因的基序比较一致,而组间存在一定的差异性,表明秋茄基因家族的分类是可靠的。10个保守基序(motif)的序列长度在21~50 bp之间,所有成员几乎都具有保守基序1,表明保守基序1是基因家族的核心保守基序。由图3可知,保守基序1和保守基序3属于WRKY保守七肽;保守基序2和保守基序4属于锌指结构。保守基序1和保守基序2在Ⅰ组 C端、Ⅱ组和Ⅲ组中都有出现,唯独Ⅰ组 N 端没有,而保守基序3和保守基序4只出现在Ⅰ组N端,已有研究表明,在基因家族中Ⅰ组成员是Ⅱ组和Ⅲ组成员的原始祖先,这种分布特征表明Ⅱ组和Ⅲ组中的WRKY结构域可能来源于Ⅰ组C端结构域,且它们可能具有相似的功能。基因外显子数量为2~9 个,内含子数量为1~8个,少数成员无 UTR区域,的基因结构是多样的,保守基序和外显子的差异可能会赋予基因功能多样性。

2.5 KcWRKY转录因子染色体定位和复制关系

染色体定位结果表明,71个秋茄基因不均匀分布在秋茄基因组18条染色体上(图5),其中,Chr12上基因分布最多,有10个,Chr18上分布的基因最少,只有1个。基因分布与染色体长度没有明显的相关性。根据Holub等的研究,在200 kb内包含2个或多个基因的染色体区域被定义为串联重复事件,在秋茄基因组中共发现4对串联重复基因对(、和、),分别位于Chr10、Chr12和Chr13上。另外,基因存在大量片段复制基因,这些基因在秋茄基因家族进化中发挥了重要作用,是基因扩张的主要驱动力。为了更好地理解作用于基因家族的进化约束条件,计算了基因对的/,所有串联重复和片段复制的基因对的/<1,表明基因家族在进化过程中可能经历了很强的纯化选择压力。

2.6 KcWRKY转录因子蛋白互作网络分析

蛋白互作网络分析结果(图6)表明,KcWRKY转录因子之间关联紧密,KcWRKY66、KcWRKY68、KcWRKY70、KcWRKY71是互作网络中的关键节点,在蛋白互作网络中可能会发挥关键作用。且主要与镁离子螯合酶ChlH(magnesium-chelatase subunit ChlH,简称GUN)、细胞分裂原激活蛋白质激酶(MAP kinase substrate,简称MKS)、丝裂原活化蛋白激酶(mitogen-activated protein kinase,简称MPK)、sigma factor binding protein(SIB)存在网络相互作用。SIB作为激活剂在植物防御坏死营养病原体中发挥作用,MPK可能使WRKY转录因子的调控因子磷酸化,介导胁迫基因转录,MKS与WRKY转录调节因子相互作用调控胁迫响应。这些蛋白间的相互作用可能在秋茄独特的抗逆机制中发挥了关键作用。

2.7 KcWRKY转录因子启动子顺式作用元件分析

基因家族启动子的顺式作用元件分析结果见图7,主要关注植物生长发育,激素调控和逆境胁迫有关的作用元件。家族成员启动子含有大量茉莉酸甲酯响应(MeJA responsiveness)元件和脱落酸响应(abscisic acid responsiveness)元件,含有较多的低温响应(low-temperature responsiveness)元件、赤霉素响应(gibberellin responsiveness)元件和水杨酸响应(salicylic acid responsiveness)元件,这可能意味着KcWRKY蛋白是通过激素调控介导途径响应胁迫的。其中和包含8种顺式元件,这可能意味着这2个基因在秋茄生长发育和抗逆胁迫中发挥着十分重要的作用。

2.8 KcWRKY基因在不同器官中的表达模式

表达模式分析结果如图8所示,所有的基因都至少在1个器官中表达,其中、、、和在所有器官中均有高水平的表达。花、根和茎中表达量最高的是,在叶和果实发育前期均具有最高表达,、、、和在果实发育后期具有较高表达。随着果实的不断发育,4、24、50、68在果实中的表达量提高。

3 讨论与结论

本研究在秋茄基因组中鉴定了71个基因,与拟南芥中(72个)的基因数量差不多,但比水稻(102个)和杨树(104个)的少。通过对KcWRKY蛋白保守结构域进行序列分析发现,和这2个WRKY家族成员的核心结构域发生了变异(WRKYGEK、WRKYGKK),与水稻中常见的突变形式一致。相关研究表明,在大豆中具有WRKYGKK变型的和失去了对W-box的结合能力,而在烟草中,具有 WRKYGKK变型的特异识别WK box(TTTCCAC),当WRKYGKK 突变为WRKYGEK后,便失去了对 WK box的结合能力。推测和的WRKY七肽结构域发生变型可能使其无法识别并结合W-box,或识别其他基序,产生新功能。的C端WRKYGQK七肽结构域出现缺失,形成了WRK的缺失变型,而同样的情况出现在香石竹的N端。启动子顺式元件分析结果显示,家族成员含有激素调控和逆境胁迫相关的顺式作用元件,其中响应脱落酸应答的顺式作用元件最多,推测KcWRKY蛋白在植物激素调控植物的生物过程及逆境响应过程中起着重要作用且功能复杂,这可能与秋茄能够适应复杂的潮间带环境有关。

系统发育分析发现,家族成员符合基因家族的一贯分类,除少数几个KcWRKY蛋白结构域部分缺失和变异之外,其他蛋白均具有完整准确的结构域,一定程度上说明家族在进化上相对保守。在基序组成上,秋茄的Ⅰ组C端WRKY结构域与Ⅱ组、Ⅲ组WRKY结构域含有相同的保守基序,和三浅裂野牵牛的结论一致,支持Ⅱ组、Ⅲ组WRKY成员的结构域可能由Ⅰ组C端结构域进化而来的假设;Ⅱ组是基因数量最多的一组,占基因家族的63.3%,表明Ⅱ组可能在进化过程中发生了显著扩张,与大多数物种研究结果一致;Ⅱa组基因数量最少(2个),可能是因为它的进化时间相对其他组较短,是基因家族中所有组中最后演化出来的。家族成员中出现保守基序的缺失,并未全部形成保守基序1-保守基序2的稳定结构,解释了秋茄WRKY 保守结构域部分发生变异和缺失的原因,表明秋茄可能在变异中不断获得进化。

基因在不同器官的表达模式分析结果表明,在花、根、茎、叶和果实前中后期均有表达,是的同源基因,参与调节编码线粒体和叶绿体蛋白的胁迫响应基因,说明可能也具有此功能。在叶和果实发育后期表达量较高,和互为同源基因,的表达会诱导叶片的衰老,表明可能参与秋茄叶和果实衰老的调节。

猜你喜欢
秋茄锌指基序
EPIYA 基序与幽门螺杆菌感染相关胃病关系的研究进展
带TRS基序突变的新型冠状病毒威胁更大
锌指蛋白与肝细胞癌的研究进展
芥蓝Aux/IAA家族基因生物信息学与表达分析
海洋中药秋茄的化学成分及药理活性研究进展
C2H2型锌指蛋白在肿瘤基因调控中的研究进展
Myc结合的锌指蛋白1评估实验性急性胰腺炎疾病严重程度的价值
补论吴兆骞《秋茄集》版本——以康熙间徐乾学刻本为主
锌指蛋白及人工锌指蛋白对微生物代谢影响的研究进展
基于金钗石斛EST的短串联重复序列的挖掘