洋草麦HdCAD 基因的克隆与生物信息学分析

2021-06-23 09:38郝丽芬房永雨赵俊利史志丹詹鹤年丁海君
畜牧与饲料科学 2021年3期
关键词:进化树结构域克隆

郝丽芬,房永雨,孙 林,赵俊利,史志丹,詹鹤年,丁海君

(内蒙古自治区农牧业科学院,内蒙古 呼和浩特 010031)

洋草麦 (alien barley) 是一年生禾本科(Gramineae)作物,又称二棱大麦[1](Hordeum distichon)。 洋草麦分蘖性强,茎秆纤细,茎叶量大,营养丰富,是一种优质饲用大麦品种,耐旱性较强,但存在倒伏率较高的缺点,尤其在雨季,伴随大风天气,极易造成减产和品质损失。

许多研究表明,茎秆强度是植物抗倒伏的关键因素之一,茎秆强度又受到木质素含量的影响[2-4]。目前认为木质素生物合成途径有苯丙酮酸途径、莽草酸途径、木质素单体及其聚合物特异途径等[5-6]。木质素的生物合成途径较多, 并涉及很多关键酶基因和转录因子的调控[7],以NADPH 为辅酶的肉桂醇脱氢酶(cinnamyl alcohol dehydrogenase,CAD)是催化木质素单体合成的关键限速酶[8-9]。 目前在很多植物中已克隆得到CAD 基因,并进行了表达分析和调控机制的研究[10-14],但在洋草麦中还未见研究报道。

该研究以前期转录组测序结果中的洋草麦肉桂醇脱氢酶基因(命名为HdCAD 基因)序列为参考序列,采用RT-PCR 技术,获得其CDS 序列并对其编码蛋白序列进行了生物信息学分析。 通过该研究拟为揭示HdCAD 基因序列特性,以及为研究HdCAD 基因及其编码的HdCAD蛋白的相关功能提供参考。

1 材料与方法

1.1 试验材料

1.1.1 试验样品洋草麦种子由内蒙古自治区农牧业科学院草原研究所牧草种质资源室提供。2020 年5 月初播种于内蒙古自治区农牧业科学院院内试验基地,2020 年7 月中旬, 采集地上部分,迅速装入塑封袋并置于液氮内,用于RNA 的提取。

1.1.2 试验试剂洋草麦总RNA 提取使用PureLinkTMRNA 小提试剂盒(赛默飞);反转录采用PrimeScript Ⅳ1st strand cDNA Synthesis Mix(TaRaKa); 聚合酶链式反应及其产物凝胶回收采用TransTaq®DNA Polymerase High Fidelity、Easy-Pure®PCR Purification Kit(北京全式金);克隆载体为pEASY R-T1; 大肠杆菌感受态采用Chemically Competent®Cell(北京全式金);引物由北京华大六合基因有限公司合成。 测序由生工生物工程(上海)股份有限公司完成。

1.2 试验方法

1.2.1 洋草麦总RNA 的提取将贮藏于液氮内的植株材料取出,置于经液氮预冷的研钵内,迅速研磨, 提取方法按照赛默飞PureLinkTMRNA 小提试剂盒说明书。 提取后,进行琼脂糖凝胶(1%)电泳,检测其完整性。

1.2.2 洋草麦cDNA 的合成采用PrimeScript Ⅳ1st strand cDNA Synthesis Mix 试剂盒进行反转录,按照说明书进行操作,获得洋草麦cDNA。 反转录体系为20 μL:总RNA(100 ng/μL) 3 μL,Random 6 mers (50 μmol/L)1 μL,5×PrimeScript 1st strandⅣcDNA Synthesis Mix 4 μL,RNase-free Water 12 μL。 轻柔混匀后:30 ℃温育10 min、42 ℃温育10 min,95 ℃灭活1 min,冰上冷却。取部分PCR 产物用于基因克隆, 剩余PCR 产物保存于-80 ℃冰箱内。

1.2.3 洋草麦HdCAD 基因克隆与测序根据已有洋草麦转录组测序结果,调取洋草麦HdCAD 基因的CDS 片段,利用Primer premiere 5.0 软件设计引物,引物信息见表1。PCR 反应体系见表2,反应程序为:94 ℃预变性3 min;95 ℃变性10 s、58 ℃退火10 s、72 ℃延伸1 min,29 个循环;72 ℃延伸10 min;4 ℃保 持。 将PCR 产 物 回 收 后, 连 接 到pEASY®-T 克隆载体上, 转化至Trans1-T1,37 ℃条件下,在含Amp+的LB 平板培养基上过夜培养,经蓝白斑筛选和菌斑PCR 验证后,送生工生物工程(上海)股份有限公司进行基因测序。

表1 洋草麦HdCAD 基因克隆的引物信息

表2 洋草麦HdCAD 基因克隆的PCR 反应体系

1.2.4 洋草麦HdCAD 基因和HdCAD 蛋白的生物信息学分析将转录组数据中HdCAD 基因与克隆得到的HdCAD 基因序列进行比对,以克隆测序的片段为准。 HdCAD 蛋白的基本理化性质分析、结构域分析、二级结构预测分析、三级结构建模、 系统进化树构建等生物信息学分析参考房永雨等[15]报道的方法,亚细胞定位预测分析采用在线预测软件(https://wolfpsort.hgc.jp/)。

2 结果与分析

2.1 洋草麦HdCAD 基因克隆结果

洋草麦总RNA 电泳结果显示, 提取的总RNA 有28S 和18S 共2 条明亮、清晰的条带(见图1),说明提取的RNA 完整,质量好,可以进行反转录及后续试验研究。PCR 产物片段经胶回收、转化大肠杆菌进行测序, 克隆得到的洋草麦Hd-CAD 基因的编码区(CDS)为1 071 bp(见图2),与转录组测序结果比对后, 相似度为99.5%, 编码356 个氨基酸(见图3)。

图1 洋草麦总RNA 凝胶电泳图

图2 HdCAD 基因克隆结果

2.2 HdCAD 蛋白生物信息学分析

2.2.1 HdCAD 蛋白基本理化性质分析结果经过Prot Param tool 在线软件预测,HdCAD 蛋白的相对分子量为87 343.11 Da,等电点(pI)为4.98,分子式为C3013H4957N1071O1240S353,原子总数为10 634,估计在酵母菌内半衰期大于20 h, 不稳定指数为56.03,属于稳定类型的蛋白,脂肪指数为16.99,GRAVY 为0.883, 为疏水性蛋白。 分析洋草麦HdCAD 蛋白磷酸化位点,结果显示,该蛋白存在9个丝氨酸(serine)磷酸化位点、6 个苏氨酸(threonine)磷酸化位点、2 个酪氨酸(tyrosine)磷酸化位点(见图4)。 洋草麦HdCAD 蛋白不含有跨膜结构域,编码区蛋白定位到细胞质中,编码区蛋白不含有信号肽。

2.2.2 HdCAD 蛋白保守结构域以及二、三级结构分析结果对HdCAD 蛋白保守结构域进行预测,结果显示,含有CAD1 保守结构域,属于MDR 超家族,其中含有1 个NAD(P)结合位点,具有氧化还原酶活性, 此外还含有3 个催化锌结合位点和4 个底物锌结合位点(见图5)。分析编码区二级结构,发现该蛋白的CDS 区无规则卷曲含有160 个氨 基 酸 (44.94%),α 螺 旋 含 有80 个 氨 基 酸(22.47%),延伸链含有90 个氨基酸(25.28%),β转角含有26 个氨基酸 (7.30%)(见图6)。 利用SWISS-MODEL 构建基因的CDS 区三级结构模型,以高粱肉桂醇脱氢酶蛋白质(SMTL ID:5 vkt.1) 为三维结构模板, 预测HdCAD 蛋白的空间结构,两者一致性达到79.8%,其结构模型为椭球形(见图7)。

2.2.3 HdCAD 蛋白序列的多重序列比对和系统进化树分析在NCBI 网站中,利用Blastp 程序对HdCAD 蛋白序列进行检索, 从NCBI 网站下载HdCAD 蛋白的同源序列,结果表明,其与二粒小麦TtCAD(accession number:XP_037434468.1)、节节麦AtCAD(accession number:XP_020159838.1)、西 藏 裸 大 麦 HvCAD (accession number:KAE8784648.1)、 乌拉尔图小麦TuCAD(accession number:EMS68862.1)的蛋白相似度最高,均大于90%,分别为96.35%、95.79%、94.94%、96.66%;与二 穗 短 柄 草 BdCAD (accession number:XP_003576507.2)、黑麦草LpCAD(accession number:XP_003576507.2)、弯叶画眉草EcCAD(accession number:TVU09473.1) 的蛋白相似性均大于80%, 分别为84.31%、82.87%、80.74%。 利用DNAMAN 软件将洋草麦HdCAD 蛋白与其他同源蛋白进行多重序列比对,结果显示HdCAD 蛋白含有多个保守序列(见图8)。 利用MEGA 7 软件的CLUSTER W 进行同源序列比对,使用邻接法构建系统进化树, 系统进化树分析结果显示, 洋草麦HdCAD 蛋白与二粒小麦亲缘关系最近,其次是节节麦、西藏裸大麦;与拟南芥、烟草的亲缘关系较远,与多重比对结果一致(见图9)。

图3 HdCAD 基因克隆序列与转录组序列比对图

图4 HdCAD 蛋白磷酸化位点预测

图5 HdCAD 蛋白保守结构域预测结果

图6 HdCAD 蛋白的二级结构预测结果

图7 HdCAD 蛋白的三级结构预测结果

图8 HdCAD 蛋白与其他植物CAD 氨基酸序列的多重序列比对结果

3 讨论与结论

肉桂醇脱氢酶基因(CAD)是木质素合成的关键基因之一, 该研究在二代转录组测序数据的基础上,通过RT-PCR 技术,克隆洋草麦肉桂醇脱氢酶基因(HdCAD)的CDS 序列,大小为1 071 bp,编码356 个氨基酸。 通过查阅相关文献和NCBI 数据库搜索,目前获得和预测的植物CAD 基因CDS序列的长度在978~1 104 bp[16-17]。其同源氨基酸比对结果发现,除C 端靠前的序列差异较大外,其在进化上还存在一定的保守性[7]。

通过生物信息学分析预测HdCAD 蛋白共有17 个磷酸化位点。 该蛋白为不含有跨膜结构域和信号肽位点,预测定位到细胞质中,不属于膜蛋白或分泌蛋白, 这与大多克隆到的CAD 基因结果相同[18-19]。 在洋草麦HdCAD 蛋白二级结构中无规卷曲是主要结构元件,其次是延伸链、α 螺旋、β 转角结构元件,这与非洲菊[11]、蜜柚[13]、蜡梅[18]、巨龙竹[20]等植物相同,都是无规则卷曲结构占比最大。洋草麦HdCAD 蛋白含有多个催化锌结合位点和底物锌结合位点,具有典型的CAD1 结构域。 系统进化树分析结果显示,HdCAD 蛋白与二粒小麦、节节麦、西藏裸大麦亲缘关系最近,这也从分子层面上揭示,该品种的培育可能来源于大麦、小麦或者山羊草属植物。

图9 不同植物CAD 蛋白序列系统进化树分析结果

随着退牧还草制度的实施, 人工建植牧草品种的需求越来越大, 洋草麦作为一种优良的饲用牧草,可以在人工建植草地中发挥一定作用。该研究首次获得了洋草麦的HdCAD 基因,为下一步研究洋草麦抗非生物胁迫的功能提供参考。

猜你喜欢
进化树结构域克隆
克隆狼
细菌四类胞外感觉结构域的概述
基于心理旋转的小学生物进化树教学实验报告
常见的进化树错误概念及其辨析*
浙江:诞生首批体细胞克隆猪
革兰氏阳性菌蛋白结构域特征分析
福州2009—2014年甲型H1N1流感病毒株HA基因进化分析
艾草白粉病的病原菌鉴定
重组绿豆BBI(6-33)结构域的抗肿瘤作用分析
属于“我们”