红树莓CPP 转录因子家族的生物信息学及表达分析

2023-12-11 04:37郑奕宸吴菁菁顾玉红
河北农业大学学报 2023年6期
关键词:基序树莓拟南芥

郑奕宸,李 明,李 闯,吴菁菁,李 寒,顾玉红

(1.河北农业大学 生命科学学院,河北 保定 071001;2.河北农业大学 林学院,河北 保定 071001)

红树莓(Rubus idaeusL.)又名覆盆子、悬钩子、托盘等,属于蔷薇科悬钩子属,在寒带和温带各地均有分布[1]。成熟果实为聚合性小浆果,是同时含有营养和保健功能的第3 代新兴水果之一,有“世界水果之王”的称号,具有很高的商业价值[2]。其果实成熟时不仅具有诱人的红色,独特的风味,且富含鞣花酸、水杨酸、花青素和氨基酸等营养物质,鞣花酸、水杨酸和花青素等酚类物质具有抗氧化、抗炎的作用[3],并且具有抑制阿尔茨海默病进展的潜力[4],氨基酸对肠道微生物健康具有重要作用[5];有研究从树莓果肉中分离出的新型酸性多糖(RPP-3a)具有免疫刺激和抗氧化活性,是一种有益健康的功能性膳食补充剂[6]。

CPP(Cysteine-rich Polycomb-like Protein)或TCX(tesmin/TSO1-like CXC protrin)转录因子,是一类成员较少的转录因子家族,在动植物中均有分布,但在酵母和原核生物中未检测到[7]。转录因子作为生物体内与基因特异性结合并调节翻译程序的蛋白质,参与代谢调节[8]、环境胁迫适应[9-10]以及生长发育[11]等多种生命活动,是了解生命活动作用的关键因子。CPP 家族的典型结构是一个富含半胱氨酸的CRC 结构域,是由2 个高度保守的CXC 结构域和之间的R 结构构成的,可与其它基因启动子区域相互作用调控表达或抑制目的基因[12]。已有研究表明,拟南芥CPP 基因家族的TSO1基因作为细胞分裂调节因子在花分生组织中发挥作用[13];番茄果实中的SlCPP4通过直接调控RIN和LAA9基因的表达调控番茄果实成熟过程[14];玉米中的ZmCPP基因在冷、热、干旱和盐胁迫反应条件下均有差异表达,参与了玉米多种胁迫的生理过程[15];橡胶树叶片中HbCPP1基因受到外源ABA处理后表达量显著上调,积极响应ABA 的诱导,参与调节植物的生长发育[16]。这些结果表明,CPP转录因子在调节植物生长发育以及响应胁迫过程中具有重要作用。除此之外,前人在大麦[17]、大豆[18]、茶树[19]和陆地棉[20]等多种物种中对CPP 转录因子完成了鉴定与分析,而红树莓中还没有关于CPP转录因子的报道。

本研究通过生物信息学分析方法对‘海尔特兹’红树莓转录组数据库中得到的CPP 转录因子家族的基本信息进行分析,使用在线软件对其理化性质、磷酸化位点、信号肽、亚细胞定位、跨膜结构、二级结构、三级结构、基因结构、保守基序、系统进化树、启动子顺式作用元件、表达量进行分析,进一步利用实时荧光定量PCR(qRT-PCR)技术研究CPP转录因子家族在果实发育过程中表达量的变化,旨在阐明红树莓CPP 转录因子家族的生物信息学信息及其在果实不同发育时期中表达的变化规律,并结合两者信息以期为RuCPPs基因功能的研究提供理论参考。

1 材料和方法

1.1 材料

供试材料红树莓品种为‘海尔特兹’,以青果(花后15 d)、黄果(花后25 d)、红果(花后28 d)、深红果(花后30 d)4 个发育时期的红树莓果实为材料,将果实采集后,用液氮速冻后-80 ℃冰箱冻存备用。

1.2 方法

1.2.1 RNA 的提取和转录组测序 使用多糖多酚植物总RNA 提取试剂盒提取红树莓果实中的RNA,每个发育时期的红树莓果实均进行3 次重复。将提取的RNA 样品送至北京诺禾致源科技股份有限公司进行转录组测序,测序结果上传至上海美吉生物云平台(https://cloud.majorbio.com/)进行后续数据分析。

1.2.2 红树莓CPP 基因家族生物信息学分析 在美吉生物云平台(https://cloud.majorbio.com/)转录组数据中鉴定出4 个CPP 转录因子家族成员,将其依次命名为RuCPP-1、RuCPP-2、RuCPP-3、RuCPP-4,并下载蛋白质序列等相关信息。分别利用ProtParam(https://web.expasy.org/protparam/)、ExPASy–ProtScale(https://web.expasy.org/protscale/)、NetPhos 3.1 Serve(https://services.healthtech.dtu.dk/service.php?NetPhos-3.1)、SignalP 5.0 Server(http://www.cbs.dtu.dk/services/SignalP/)、Cell Ploc 2.0(http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/)、TMHMM 2.0(https://services.healthtech.dtu.dk/service.php?TMHMM-2.0)、SMART(http://smart.emblheidelberg.de/)、和SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)、SWISS-MODEL(https://swissmodel.expasy.org/)分析‘海尔特兹’红树莓中CPP 转录因子家族4 个成员的理化性质、亲疏水性、磷酸化位点预测、信号肽预测、亚细胞定位、跨膜结构预测、保守结构域、二级结构、三级结构。

1.2.3 红树莓CPP 基因家族成员的系统进化分析 利用转录组数据库下载‘海尔特兹’红树莓CPP 转录因子家族的蛋白质序列,从plantTFDB 网站上获取拟南芥、野生稻CPP 蛋白序列。通过MEGA11 软件,使用邻接法(Neighbor-Joining),进行1 000 次重复,分别将4 个RuCPP 蛋白序列与拟南芥和水稻CPP 蛋白序列构建系统发育树,再利用ITOL(https://itol.embl.de/)在线网站对进化树进行美化。

1.2.4 红树莓CPP 基因家族成员基因结构及蛋白保守基序分析 利用转录组数据库下载‘海尔特兹’红树莓CPP 转录因子家族的CDS 序列和基因序列,利用GSDS 在线分析RuCPPs基因结构;利用MEME 网站导出RuCPPs基因保守基序文件,设置保守基序为10 个,并通过TBtools 软件生成图片。

1.2.5 红树莓CPP 基因家族成员的启动子顺式作用元件分析 利用NCBI 网站查找RuCPPs基因长度为2 000 bp 的启动子序列,利用PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)预测RuCPPs 基因家族成员的启动子顺式作用元件。

1.2.6 红树莓CPP 基因家族成员在果实发育过程中的表达分析 转录表达分析是以‘海尔特兹’4 个发育时期果实的转录组测序FPKM(Fragments Per Kilobase per Million)值作为基因表达量进行表达分析并在美吉云平台制作热图。

qRT-PCR 表达分析是先提取树莓果实4 个发育时期青果、黄果、红果和深红果的RNA,使用反转录试剂盒合成cDNA。以GAPDH基因作为内参,设计CPP 家族基因的特异性引物进行qRT-PCR 分析(表 1),使用Premier 软件设计特异性引物,由生物工程股份有限公司合成。每个样品进行3 次重复。PCR 反应体系为:水9.5 μL,模板2 μL,上下游引物各0.5 μL,2×M5 HiPer SYBR PremixEsTaq12.5 μL。实时荧光定量PCR 程序:96 °C 预变性30 s;95 °C 5 s,60 °C 30 s,39 个循环。利用2-ΔΔCT法对基因相对表达量进行计算。

表1 RuCPP 和GAPDH 的引物序列Table 1 Primer sequences of RuCPP and GAPDH

2 结果与分析

2.1 红树莓CPP 基因家族生物信息学分析

由表2 可知,RuCPPs 编码的蛋白质氨基酸数量在433~793 个之间,相对分子质量在47 175.57~86 763.46 kD 之间,等电点在5.83~9.20之间。RuCPPs 的不稳定系数大于40,为不稳定存在的蛋白质。亲水性平均系数均小于0,均为亲水性蛋白质。磷酸化位点预测结果显示,RuCPP-4 基因的磷酸化位点最多,为110 个,RuCPP-1 的磷酸化位点最少,为39 个,4 个成员中含有磷酸化位点最多的氨基酸均为丝氨酸,其次为苏氨酸,最少的为酪氨酸。信号肽预测显示4 个成员均无信号肽,说明为非分泌蛋白质。亚细胞定位预测发现4 个成员均定位于细胞核。跨膜结构预测显示4 个成员均无跨膜结构。保守结构域预测显示,RuCPPs 均在不同位置含有2 个CXC 保守结构域,推测CXC 为CPP 蛋白中央结合DNA 保守结构域。

表2 红树莓CPP 基因家族成员编码蛋白质的理化性质Table 2 Physico chemical properties of CPP proteins in red raspberry

由表3 可知,二级结构预测结果显示RuCPPs编码的蛋白质均由α 螺旋、β 转角、无规则卷曲、折叠延伸链共4 种结构构成,RuCPP-1、RuCPP-2、RuCPP-3、RuCPP-4 占比大小排序均为无规则卷曲>α 螺旋>折叠延伸链>β 转角,即无规则卷曲占比最大,使蛋白质更卷曲折叠,α 螺旋占比次之,推测其蛋白空间结构比较小;三级结构预测结果与二级结构一致,可信度较高。

表3 红树莓CPP 基因家族编码蛋白质的二、三级结构分布信息Table3 Distribution information of secondary and tertiary structures of CPP proteins in red raspberry

2.2 红树莓CPP 基因家族成员基因结构及蛋白保守基序分析

利用GSDS 在线网站制作RuCPPs 基因家族成员的基因结构,如图1 所示;利用TBtools 软件结合各成员进化关系、保守基序和基因结构,如图2所示。可以看到RuCPPs 基因含有8~12 个外显子,7~11 个内含子;RuCPPs 含有7~8 个保守基序motif,4 个基因均含有motif1、motif2、motif3、motif4 和motif7,推测这5 个保守基序为RuCPPs发挥作用的功能结构域;RuCPP-1、RuCPP-2、RuCPP-3、RuCPP-4 基因分别含有8、8、11 和10段CDS 序列,为之后编码蛋白质做准备。

图1 红树莓CPP 基因家族编码蛋白质的外显子结构Fig. 1 Exon structure of CPP genes in red raspberry

2.3 红树莓CPP 基因家族成员的系统进化分析

红树莓的4 个CPP 基因与拟南芥的7 个CPP基 因、野生稻 的18 个CPP 基因共29 个CPP 基因共同制作系统发育树,如图3 所示,可以看到分为4 个不同分组,RuCPP-1 和RuCPP-3 基因共为一个分组,亲缘关系较近,并且与拟南芥(Arabidopsis halleri,Araha.8902s0003.1.p)和(Araha.0305s0002.1.p)聚 为1 类;RuCPP-2 基因与野生稻(Oryza barthii)(OBART04G02690.1)、拟南芥(A.halleri,Araha.28677s00001.1.p)聚为1 类;RuCPP-4 基因与 拟南芥(A.halleri,Araha.1020s0004.1.p)和(Araha.34278s00001.1.p)聚为1 类。综上所述,说明RuCPPs 家族基因与拟南芥的CPP 基因亲缘关系较近,并且可能与上述基因具有相似的生物学功能。

图3 红树莓4 个CPP 基因的系统进化分析Fig. 3 Systematic evolution analysis of four CPP genes in red raspberry

2.4 红树莓CPP 基因家族成员的启动子顺式作用元件分析

在RuCPPs 基因转录调控区域含有的能与特异转录因子结合进而影响转录水平的一端DNA 序列,可以直接调控基因表达,所以研究其作用元件极为重要。由图4 可知,RuCPPs 基因的启动子顺式作用元件包含参与光反应的元件或元件的一部分:RuCPP-1 和RuCPP-3 的GT1-motif、RuCPP-2的3-AF1 binding site、RuCPP-4 的TCT-motif、RuCPP-1 的MYBHv1 结合位 点、RuCPP-1 的CCAAT-box;参与黄酮类生物合成基因调控的MYB 结合点:RuCPP-4 的MBSI;参与脱落酸反应性的顺式作用元件:RuCPP-1、RuCPP-2、RuCPP-3 和RuCPP-4 的ABRE;参与防 御和应激反应的顺式作用元件:RuCPP-4 的TC-rich repeats;厌氧诱导和缺氧特异性诱导所必需的顺式作用调节元件:RuCPP-1、RuCPP-2、RuCPP-3和RuCPP-4 的ARE;参与低温反应性的顺式作用元件:RuCPP-3 的LTR;参与生长素反应性的元件:RuCPP-2 和RuCPP-3 的TGA-element;参与赤霉素反应性的元件:RuCPP-2 的GARE-motif、RuCPP-4 的P-box;参与干旱诱导的MYB 结合点:RuCPP-2 的MBS;参与光反应的MYB 结合位点:RuCPP-1 的MRE;参与胚乳表达的顺式调控元件:RuCPP-3 和RuCPP-4 的GCN4-motif;与分生组织表达有关的顺式调节元件:RuCPP-2 和RuCPP-3的CAT-box;参与水杨酸反应性的顺式作用元件:RuCPP-2 的TCA-element;参与MeJA 反应的顺式作用调控元件:RuCPP-2、RuCPP-3 和RuCPP-4的CGTCA-motif。以上结果表明RuCPPs 基因在调节植物激素、抵抗外界机械伤害、响应光反应、干旱诱导、缺氧诱导、胚乳和分生组织表达以及调节植物生长发育过程中发挥重要作用。

图4 红树莓4 个CPP 基因的启动子顺式作用元件Fig. 4 Cis-acting elements on the promoters of four CPP genes of red raspberry

2.5 红树莓CPP 基因家族成员在果实发育过程中的表达分析

转录组表达量结果如图5 所示。

图5 红树莓4 个CPP 基因在果实发育时期的转录组的表达量Fig. 5 Transcriptome analysis of four CPP genes in red raspberry during fruit development

红树莓果实从青果发育到深红果的过程中,RuCPP-1 基因的表达量呈下降趋势,青果时期的表达量最高;RuCPP-2 基因的表达量整体呈先上升再下降趋势,红果时期表达量最高;RuCPP-3 基因的表达量整体呈上升趋势,深红果时期表达量最高;RuCPP-4 基因的表达量整体呈下降趋势,青果时期的表达量最高。

qRT-PCR 试验表达量结果如图6 所示,RuCPP不同基因在果实发育不同时期均有不同程度的表达,且与转录表达趋势一致,均表明该基因家族可能参与果实的发育过程。以青果时期的表达量作为对比,除RuCPP-2 基因在红果时期以及RuCPP-3 基因在深红果时期的相对表达量较高之外,其余时期中的相对表达量均低于青果时期。

图6 红树莓4 个CPP 基因在果实发育时期的qRT-PCR表达量Fig. 6 Expression of four CPP genes detected by qRT-PCR during fruit development of red raspberry

3 讨论与结论

3.1 CPP 基因家族成员的生物信息学分析

CPP 转录因子家族是存在于多种植物中的转录因子,在杧果[21]、大豆[18]、茶树[22]的3 个品种‘Yunkang10’‘Biyun’和‘Shunchazao’中分别被鉴定出10、20、7、8 和8 个成员。本研究从‘海尔特兹’红树莓转录组数据库中得到4 个CPP家族成员,并通过生物信息学分析与转录组表达量结合研究鉴定其功能,增加了CPP 转录因子的植物种类。本研究中理化性质分析说明RuCPPs 均为亲水性蛋白质,与茶树[22]中预测CsCPP 为亲水性蛋白质结果一致;亚细胞定位预测结果为RuCPP-1、RuCPP-2 和RuCPP-4 定位在细胞核中,RuCPP-3定位在细胞核或细胞膜中,与小麦[23]的试验验证结果大多定位于细胞核中类似;CPP基因的典型结构域就是由R 基序分离的2 个高度保守的CXC 结构域[24],本研究的结果同样为这一观点进行补充验证,但不同基因的保守结构域位置不同,这种不同可能是基因行使不同功能的原因;对RuCPPs进行基因结构、系统进化树和启动子顺式作用元件分析,结果显示处于进化关系较近的RuCPP-1 和RuCPP-3 的基因结构类似;并且红树莓与双子叶植物拟南芥的进化关系较近,与单子叶植物野生稻的进化关系较远,这种结果与拟南芥、粳稻和玉米[25]的进化关系一致,表明CPP基因随着被子植物中单子叶植物和双子叶植物的演化进行分化。

3.2 CPP 基因家族成员的表达分析

RuCPPs基因启动子顺式作用元件结果与其它植物结果类似,大麦HvCPP[17]中含有大量ABA、GA 激素响应元件、黄瓜CsCPP[26]中含有大量与胁迫相关的顺式作用元件,RuCPPs基因显示含有调节植物激素、抵抗外界机械伤害、响应光反应、干旱诱导、缺氧诱导、胚乳和分生组织表达以及调节植物生长发育的元件,表明RuCPPs基因可能在激素信号传导和抵抗逆境胁迫中起重要作用;RuCPPs基因在果实发育过程中的转录组的表达量和qRTPCR 表达量变化均发现,不同基因在果实不同时期的表达量不同,RuCPP-1 和RuCPP-4 基因在青果时期的表达量最高,RuCPP-2 和RuCPP-3 基因分别在红果和深红果时期的表达量最高,而RuCPPs基因均含有与脱落酸相关的顺式作用元件,所以推测RuCPP-1 和RuCPP-4 基因参与脱落酸的负调控反应,RuCPP-2 和RuCPP-3 基因参与脱落酸的正调控反应,具体反应机制还需要进一步研究。

综上所述,本研究通过结合RuCPP 转录因子家族的生物信息学分析和表达分析结果,为进一步探索CPP 转录因子家族在红树莓果实中的功能提供基础。

猜你喜欢
基序树莓拟南芥
EPIYA 基序与幽门螺杆菌感染相关胃病关系的研究进展
拟南芥:活得粗糙,才让我有了上太空的资格
带TRS基序突变的新型冠状病毒威胁更大
芥蓝Aux/IAA家族基因生物信息学与表达分析
基于树莓派的骑行智能头盔设计
尿黑酸对拟南芥酪氨酸降解缺陷突变体sscd1的影响
基于树莓派的远程家居控制系统的设计
两种LED光源作为拟南芥生长光源的应用探究
拟南芥干旱敏感突变体筛选及其干旱胁迫响应机制探究
响应面法优化红树莓酒发酵工艺