高温胁迫下陆地棉转录组差异性分析

2023-12-18 09:27董永梅郭伟锋曹新川郭金成谢宗铭何良荣
新疆农业科学 2023年11期
关键词:差异基因测序高温

王 辉,董永梅,郭伟锋,曹新川,郭金成,谢宗铭,何良荣

(1.塔里木大学农学院,新疆阿拉尔 843300;2. 新疆农垦科学院棉花研究所,新疆石河子 832000;3.作物种质创新与基因资源利用兵团重点实验室,新疆石河子 832000)

0 引 言

【研究意义】近年来,高温天气频繁出现,高温胁迫造成作物的经济损失越来越严重[1]。高温会导致作物的光合作用等生理活动受到严重影响,并影响植株的正常生长和发育,是作物减产的主要影响因素[2]。新疆棉区高温出现时间是6~7月,35℃及以上高温天气天数达到9~33 d,而7月是棉花盛花期,高温的出现造成棉花蕾铃脱落,导致棉花质量和产量下降[3-4]。因此,高温对棉花生产的不利影响日益受到关注。【前人研究进展】转录组测序技术对于探索植物在不同条件和生长状态下,可以挖掘和发现新调控机制基因,从而为农作物、生态防护植被、优良林草植物抗逆性遗传改良以及新品种的培育奠定基础。尹波等[5]研究在高温胁迫下,番茄受高温胁迫后转录调控是一个极其复杂的过程,受到多种不同途径的共同调控,筛选出了36个功能未知的基因。徐洪国[6]研究表明在葡萄中响应高温胁迫的基因主要包括细胞渗透压、抗氧化作用、热激蛋白等基因,NAC转录因子家族、HSP20可能在强耐热品种刺葡萄抵抗高温胁迫中起着重要的作用。Waters等[7]认为,在高温胁迫下植物体内会产生大量不同种类的sHSP,是植物对高温胁迫的一种适应机制。Timperio等[8]强调,当植物受到热害,HSP作为分子伴侣发挥作用。而Kimpel等[9]则推测sHSPs可能作为热受损蛋白的保护屏障起作用;另外,sHSPs可以有效地结合变性的蛋白,阻止不可逆转的蛋白质聚集, 从而提高细胞的耐胁迫能力[10]。【本研究切入点】转录组学是一个发现不同差异表达基因的强有力工具,并已被广泛应用在一些作物品种中,包括水稻[11-12]、玉米[13]、小麦[14]、油菜[15]、马铃薯[16]、番茄[17]。其中对水稻,玉米热应激的反应进行了转录组分析。需研究陆地棉高温胁迫下关键基因的响应,比较基因表达差异。【拟解决的关键问题】采用转录组测序和分析,研究高温胁迫下棉花不同差异表达上调基因和下调基因的生物学通路,为陆地棉的高温胁迫研究及陆地棉品种在高温胁迫下的转录变化提供参考。

1 材料与方法

1.1 材 料

材料为陆地棉品系YZ1(由华中农业大学棉花育种组提供),即wide type(W)。

1.2 方 法

采用光照培养室温度(N,26℃)播种、育苗至5~6叶期,设置正常温度(N,26℃)处理和高温(H,42℃)处理,分别在4、12、24、48 h取叶片迅速置于液氮中,于-80℃冰箱保存,进行RNA提取。WN4、WN12、WN24、WN48代表YZ1在常温处理下4、12、24和48 h,WH4、WH12、WH24、WH48则代表YZ1在高温处理下4、12、24和48 h。

1.3 数据处理

测序错误率用e[18]表示,Illumina平台测得数据的碱基质量值(Quality score)表示,反映的是碱基识别出错的概率,进而衡量测序数据的可靠性,则有:Qphred=-10log10(e)。

皮尔逊相关系数r(Pearson’s Correlation Coefficient)为生物学重复相关性的评估指标[19]。r2越接近1,2个重复样品相关性越强。

RNA样品检测合格后,送美因健康科技(北京)有限公司测序,采用Illumina测序平台技术对构建好的文库进行高通量测序。使用软件:用fast qc软件进行质量控制;使用Hisat2[20]软件将质控后获得的Clean Reads与陆地棉参考基因组进行序列比对;利用feature Counts[21]计数,得到每个基因在各个样本中的原始记数(raw counts)。将数据导入R中,利用DESeq2[22]进行差异表达分析。研究选取|log2F C|>1(log2F C代表处理与对照表达量比值的对数值)及pad j<0.05(pad j代表校正后的P值)的基因作为差异表达基因;使用R语言cluster Profiler包对差异表达基因进行GO富集分析和KEGG富集分析。

2 结果与分析

2.1 测序质量检查

研究表明,Q phred=-10 log10(e)。Q30的碱基正确识别率达到99.90%,Q20碱基正确识别率为99%,测序数据可靠。表1

表1 碱基识别正确识别率与Phred分值之间的简明对应关系

2.2 样品相关性

研究表明,WN4/WH4,WN12/WH12,WN24/WH24,WN48/WH48两两比较后的r2均在0.85以上,两两比较的样本相关性较好。图1

图1 两两样品的相关性热图

2.3 陆地棉差异表达基因

研究表明,随着时间增加,差异表达基因数量有所下降,在4~12 h时,上调基因增加,下调基因减少,在12~48 h时,上调基因大量减少,下调基因先增加后减少。鉴定出383个普遍上调基因和234个普遍下调基因。随着热处理时间延长,WN4/WH4,WN12/WH12,WN24/WH24,WN48/WH48之间特异上调基因的数量呈减少趋势,上调基因数量分别为2 359个、2 171个、1 092个、418个,下调基因的数量趋于平缓增加,下调基因数量分别为1 733个、1 356个、1 424个、1 490个,下调基因的数量趋于平缓增加。图2,图3

图2 上调和下调基因总数

图3 上调和下调基因的韦恩图

2.4 共有差异表达基因GO功能富集

研究表明,差异表达基因主要富集在L-苯丙氨酸分解代谢过程、应激反应、蛋白质复性、类固醇生物合成的过程、超氧化物歧化酶活性的正调节、锌离子跨膜转运、蛋白质折叠、系统获得性抵抗力的调节、金属离子传输等生物学过程,苯丙氨酸转氨酶活性、催化活性、3-β-羟基-δ5-类固醇脱氢酶活性、过渡金属离子结合、锌离子跨膜转运体活性、金属离子跨膜转运体活性、转移酶活性,转移酰基、ATP结合、钙调素结合等分子功能,细胞质细胞组分。图4

图4 DEGs基因GO功能富集

2.5 共有差异表达基因的KEGG

研究表明,有241个(P-value<0.000 1)差异基因被注释。差异基因主要富集在类黄酮生物合成、次级代谢产物的生物合成、苯丙烷代谢、昼夜节律-植物、代谢途径、酮体的合成与降解、内质网蛋白加工等12个途径。内质网蛋白质加工富集到17个差异基因都表达下调,17个DEGs与热激反映有关,高温胁迫下,热激蛋白基因下调,受到抑制。表2,表3

表2 17个差异基因热激蛋白(HSP)

表3 差异基因KEGG富集变化

2.6 转录因子表达

研究表明,在差异基因中,鉴定出39个转录因子,其主要富集在MYB、WRKY、ERF、NAC等转录因子家族,其中WRKY和MYB两大家族具有最多差异基因,15个和9个差异基因,两大家族差异基因主要参与高温胁迫表达,且大部分基因都是上调表达,起着重要作用。表4

表4 差异基因的转录因子

2.7 高温胁迫相关基因

研究表明,在整个时期表达量差异倍数较为显著的基因Gohir.A08G104100(Small heat shock protein, chloroplastic,HSP22),热休克蛋白家族成员,是高温胁迫主要的基因,对植物的耐热性至关重要。Gohir.D08G033300(Probable 1-deoxy-D-xylulose-5-phosphate synthase 2, chloroplastic,Os07g0190000),催化丙酮酸的C原子2和3与3-磷酸甘油醛之间的酰基缩合反应,生成1-脱氧-D-木酮糖-5-磷酸(DXP),是质体类异戊二烯生物合成的限制酶,对叶绿体发育至关重要。

续表4 差异基因的转录因子

3 讨 论

3.1高温是影响植物生长发育的不利因素,造成大量的产量损失[23]。尽管高温胁迫对作物的生理效应已被广泛报道,但对其潜在的分子机制的了解仍然有限。研究对正常温度和高温胁迫下的陆地棉进行RNA-Seq测序,鉴定出陆地棉转录组上调差异表达基因383个,下调差异表达基因234个;可见,抗热基因为上调表达,高温胁迫限制了陆地棉的某些代谢活动;下调表达低于上调表达;与李川等[23]、翟秀明等[24]对植物高温胁迫下的基因表达上下调结果一致。

3.2差异表达基因GO功能富集分析,陆地棉转录组特性与生物过程、细胞成分、分子功能相关;富集到差异基因主要是L-苯丙氨酸分解代谢过程、应激反应、蛋白质复性等生物学过程,苯丙氨酸转氨酶活性、催化活性等分子功能,细胞质细胞组分。进一步对KEGG代谢通路富集,上调差异基因和下调差异基因共241个被富集到12个KEGG代谢通路,这些基因主要参与类黄酮生物合成,次级代谢产物的生物合成,昼夜节律-植物,苯丙烷代谢,酮体的合成与降解,内质网蛋白加工等途径。与许小芳[25]富集到显著通路一致。其中富集到内质网加工途径的17个热激蛋白差异基因,表达均下调,为后续研究作为参考。黄酮和类黄酮物质具有自由基清除能力和抗氧化能力,黄酮醇具有保护植物抵抗环境的各种刺激能力[26],在陆地棉中有大量差异表达基因注释到黄酮和黄酮醇生物合成路径,这些基因可能与陆地棉响应高温胁迫有关。上述代谢通路都与植物的抗逆性相关,但个别代谢通路在陆地棉中的调控机理暂不清楚,也为进一步了解陆地棉抗热机理指明了研究方向。

3.3经过高温胁迫处理后,MYB、WRKY、NAC、ERF家族大多数成员表达上调,上调应答的转录因子在非生物胁迫下能提高植物逆境适应能力,推测这4个家族的大多数成员上调表达能提高植株对热的适应性。与李鑫雨等[27]结论一致。RNA-Seq是一种在转录水平上更为精确的测定分析方法,其通量高、成本低、分辨率高、灵敏度高且不受物种限制[28-30]。

4 结 论

共鉴定出383个共有上调基因和234个共有下调基因,上调差异基因大于下调差异基因。将差异基因按GO功能分类,主要富集到上调差异基因和下调差异基因20个类别,富集到内质网加工途径的17个热激蛋白,均表现为下调,鉴定出差异基因主要集中在MYB、WRKY、NAC、ERF这4大家族成员。差异基因显著富集到类黄酮生物合成途径、苯丙烷代谢、昼夜节律-植物、内质网加工等通路;鉴定出39个转录因子,主要是WRKY和MYB两大家族;Gohir.A08G104100是热胁迫主要的基因,对植物的耐热性至关重要,Gohir.D08G033300是质体类异戊二烯生物合成的限制酶,对叶绿体发育至关重要,2个差异基因在整个时期表达量差异倍数较为显著。

猜你喜欢
差异基因测序高温
高温干旱持续 农作物亟须“防护伞”
高温季蔬菜要如此培“根”固本
杰 Sir 带你认识宏基因二代测序(mNGS)
全球高温
二代测序协助诊断AIDS合并马尔尼菲篮状菌脑膜炎1例
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
高温来袭,警惕寒湿作祟
紫檀芪处理对酿酒酵母基因组表达变化的影响
基因捕获测序诊断血癌
单细胞测序技术研究进展