不同生态类型菘蓝SLAF-seq 分子标记

2024-04-09 02:56孟瑾瑾陈红刚王惠珍
中草药 2024年7期
关键词:类群基因组遗传

刘 东,孟瑾瑾,王 盼,陈红刚,王惠珍,杜 弢

甘肃中医药大学药学院,甘肃 兰州 730000

随着分子生物技术水平的不断提高,分子标记技术应用越来越广泛,人们常采用随机扩增多态性DNA 标记(random amplified polymorphic DNA,RAPD)[1-3]、相关序列扩增多态性(sequence related amplified polymorphism,SRAP)[4-6]、限制性内切酶片段长度多态性( restriction fragment length polymorphism,RFLP)[7]、扩增片段长度多态性(amplified fragment length polymorphism,AFLP)[8-9]、简单重复序列标记(simple sequence repeats,SSR)[10-12]、ISSR 标记(inter-simple sequence repeat,ISSR)[13-15]和表达序列标签SSR(expressed sequence tags-SSR,EST-SSR)[16]等分子标记技术进行遗传多样性、亲缘关系及遗传演化等方面的研究,并取得很大进展,但这些分子标记技术都有一定的缺陷,RAPD 技术易受到模板的质量和浓度、引物序列短、PCR 循环次数、基因组DNA 的复杂性等方面的影响,造成RAPD 技术的重复性差;AFLP 技术操作复杂、成本较高,对基因组纯度和反应条件要求较高,ISSR 标记对体细胞遗传变异的检测效率低,因此,由不同分子生物技术所得结果也存在些许差异。

特异位点扩增片段测序(specific-locus amplified fragment sequencing,SLAF-seq)是基于高通量测序技术发展起来的一种简化基因组测序技术,具有通量高、准确性高、成本低、周期短的技术特点[17]。SLAF-seq 技术是通过生物信息学方法设计最佳酶切方案,构建SLAF 文库,筛选特异性长度的酶切片段(SLAF 标签),利用高通量测序技术获得大量序列,通过软件比对分析,开发大量的全基因组范围的特异性SNP 标记,利用大量的SNP 标记进行亲缘关系及遗传变异分析[18-19]、性状关联分析[20]和构建遗传连锁图谱[21]等工作,同时为分子育种、系统进化和种质资源鉴定等提供技术保障[22-23]。李贝贝等[24]利用SLAF-seq 技术进行了304 份葡萄种质遗传多样性分析,实验结果表明,我国地方品种亲缘关系较近,证实了‘小黑葡萄’是野生种的一个过渡类型的推测。Kozich 等[25]利用SLAF-seq 简化基因组测序技术对甘薯栽培种及不同倍性的近缘野生种的遗传多样性和进化关系进行分析,实验结果表明,栽培种和六倍体近缘野生种的遗传关系最近,进一步验证了栽培甘薯可能来源于Ipomoeatrifida(6X)。目前,采用SLAF-seq技术在菘蓝上开发大量SNP位点的相关研究鲜见报道。因此,本实验利用SLAF-seq 技术测定了25 个不同生态类型菘蓝材料的基因序列,获得大量的SLAF 标签,进而开发一批稳定性高、特异性强的SNP 位点。基于开发的SNP 标记对不同生态类型菘蓝间遗传多样性及群体结构进行分析,旨在从基因水平揭示不同生态类型之间的遗传关系。

1 材料

1.1 材料信息

25 个不同生态类型菘蓝的种子均是从全国各地收集而来,均为人工栽培品,引种地信息见表1,所有种子经甘肃中医药大学杜弢教授鉴定为十字花科菘蓝属植物菘蓝IsatistinctoriaL.的种子。试验于甘肃中医药大学和政药用植物园实施,园内海拔2 430 m,年均降水量660 mm,年均气温5.1 ℃,无霜期110 d。土壤为肥力均一的黑垆土。

表1 菘蓝种子编号及叶片特征信息Table 1 Table of seed number and leaf characteristic information of Isatis tinctoria

1.2 试验方法

将25 个不同生态类型菘蓝种子条播于甘肃中药大学和政药用植物园,各试验小区随机排列,3 次重复,每个试验小区的面积为19.58 m2。条播用种量为1.2 g/m2,沟深5 cm,沟宽10 cm,行距30 cm。6 月17 日出苗,6 月27 日一次性完成间苗,株距10 cm;10 月25 日观测各个试验小区叶片表观特征。在每个试验小区内随机挑选5 株,从每株相同部位采取幼嫩叶片并将其混装,1 个试验小区形成1 份混样,并对其编号,迅速投入液氮中速冻保存。

2 方法

2.1 基因组DNA 提取和检测

用CTAB 法从预先保存的叶片中提取基因组DNA,用传统的1%琼脂糖凝胶电泳法检测提取基因的完整性,并用NanoDrop 1000C 微量紫外分光光度计检测DNA 的浓度及纯度,确保提取的DNA质量满足测序要求。采用超纯水将质量浓度统一调至50 ng/μL,−20 ℃保存备用。

2.2 酶切建库

根据最优酶切方案的选择原则,应用酶切预测软件进行酶切预测,确定最优的酶切方案,当最适酶切方案确定之后,对已检测合格的样品基因组DNA 进行酶切建库。对得到的酶切片段(SLAF 标签)进行3’端加A 处理、连接Dual-index 测序接头、PCR 扩增、DNA 纯化、混样、切胶选取目的片段。

2.3 基因组测序及数据质量评估

经文库质检合格后,利用Illumina 平台进行测序[26]。为了评估酶切实验方案和酶切结果的准确性,选用水稻日本晴OryzasativaindicaL.作酶切方法和数据质量的评估对照。Dual-index 识别测序所得的原始数据,进行过滤优选得到高质量双端Clean reads,再进行测序质量和数据量的质量评估。

2.4 SLAF 标签和SNP 分析

根据生物信息学分析,在群体中开发全基因组范围的SLAF 标签,以每个SLAF 标签中深度最高的序列类型作为参考序列,利用BWA[27]将测序reads 比对到参考序列上,并使用 GATK[28]和SAMtools[29]2 种软件开发SNP,以2 种软件开发获得的SNP 交集作为最终可靠的SNP 标记数据。

2.5 群体遗传结构和亲缘关系分析

将开发的SNP 标记根据完整度>0.8,次要等位基因频率(MAF)>0.05 的标准进行过滤[30],基于筛选出的高一致性的群体SNP,使用统计软件MEGA X[31]和Admixture[32]对群体进行系统进化树和群体结构分析。

2.6 主成分分析(principal component analysis,PCA)

PCA 是一种统计方法。在群体遗传学上,主要基于不同材料的SNP 差异程度(或分歧程度)聚类成不同亚群,其结果可以用于与其他聚类方法的结果相互验证。基于SNP,通过EIGENSOFT 软件进行PCA。

3 结果与分析

3.1 叶片表观特征分析

形态学特征是植物遗传差异的最直观表现,田间栽培验证也是最简单的遗传变异的鉴别方法。田间植株叶片表观特征调查结果如表1 所示,对比分析发现25 个不同生态类型菘蓝叶片表观特征可以概述如下:叶形分为倒卵圆形和倒披针形2 种,叶尖分为尖和钝尖2 种,叶片表面都有蜡粉层,均是蜡质叶,叶柄基部根据颜色分为浅绿色和绿色2 种,叶缘根据缺刻程度分为无缺刻(全缘叶)和轻度缺刻2 种,观察叶片整体形态特征,分为无波状叶、轻度波状叶和中度波状叶。

3.2 建库评估

酶切效率是评价简化基因组试验是否成功的一个关键指标,测序reads 插入片段中残留酶切位点的比例越高,酶切效率越好[33]。本实验经过SLAF电子酶切预测软件分析,确定限制性内切酶切组合为Rsal-Haell,酶切片段长度在314~364 bp 的序列定义为SLAF 标签。为进一步评估酶切方案的有效性与酶切效率,以水稻日本晴测序数据为酶切方案和数据质量评估对照,利用SOAP[34]软件将对照的测序reads 与其参考序列进行比对,试验双端比对效率的结果为96.09%,正常酶切比例为 92.39%,说明酶切反应处于正常,此次试验选定的酶切方案正确可行,SLAF 建库正常。

3.3 测序质量评估

本实验25 个样品共获得63.32 兆数据量,菘蓝及对照测序结果如表2 所示。各样品所得到的读长总量各不相同,最大的读长总量为6 086 419(2016-8),最小的读长总量为1 498 688(2016-22)。测序的GC 碱基比例的平均值为40.13%,最小的GC 碱基比例为38.76%(2016-24),最大的GC 碱基比例为41.37%(2016-15),此次测序所有样品GC碱基比例均比较高,说明测序达到要求。测序质量值(Q)是对测序数据质检的关键指标,是测序下机后单碱基错误率大小的具体评判标准,一般测序质量值用Q30表示。此次试验测序质量值Q30均大于95%,平均Q30为96.31%,最小的Q30为95.66%(2016-3),最大的Q30为96.60%(2016-1),说明此次测序碱基错误率较低,测序质量较好。结合读长总量、GC 碱基比例及Q30比例等各个结果的数据,可以得出此次测序质量较高,所得数据结果可靠。

表2 菘蓝及对照测序结果Table 2 I.tinctoria and control sequencing results

3.4 SLAF 标签开发及SNP 信息统计

经过生物信息学等各方面分析,此次试验的每个样品标签平均测序深度为23.52X,共获得535 105 个菘蓝SLAF 标签,具体的菘蓝SLAF 标签数统计结果如表4 所示,其中共获得34 412 个多态性SLAF 标签。以每个SLAF 标签中深度最高的序列类型作为参考序列,进行SNP 位点开发,此次实验共得到63 002个群体SNP 标记。SNP 信息统计结果见表3。

表3 菘蓝SLAF 标签和SNP 统计结果Table 3 Results of I.tinctoria SLAF label and SNP statistics

3.5 系统发育树分析

基于筛选出的高一致性SNP 标记,通过MEGA X 软件,基于邻接法(neighbor-joining,NJ),采用Kimura 2-parameter 模型,bootstrap 重复1 000 次,构建各样品的系统发育树,如图1 所示。25 份不同生态类型菘蓝聚成3 组,第1 组为2016-22 和2016-26,第2 组为2016-3、2016-4、2016-5、2016-16、2016-20、2016-21,第3 组为2016-8、2016-14、2016-15、2016-1、2016-2、2016-6、2016-18、2016-19、2016-27、2018-1、2016-7、2016-9、2016-13、2016-17、2016-23、2016-24、2016-25。

图1 不同生态类型菘蓝系统发育树Fig.1 Phylogenetic trees of I.tinctoria of different ecological types

3.6 群体结构分析

根据试验筛选出的高一致性SNP 标记,利用Admixture 软件进行群体结构分析,经过交叉验证,K值为1~10 的聚类情况及各个K值对应的交叉验证错误率结果如图2、图3 所示。当K=1 时,25 个不同生态类型菘蓝基因来源为一类;当K=10 时,25 个不同生态类型菘蓝可以分为10 类。由于每个类群都存在交叉现象,说明每个类群间的亲缘关系相对较近。类群1 主要是2016-3 和2016-9,类群2 主要是2016-1 和2016-23,类群3 主要是2016-4、2016-5 和2016-26,类群4 主要是2016-24 和2016-25,类群5主要是2016-13,类群6 主要是2016-6 和2016-16,类群7主要是2016-14 和2016-15,类群8主要是2016-19 和2016-22,类群9 主要是2016-2 和2016-7,类群10 主要是2016-18、2016-27 和2018-1。而2016-8、2016-17、2016-20 和2016-21 这4 个生态类型的游离在各个类群之间,2016-8 相比较而言,较为接近类群10(遗传特征值为0.373 1),2016-17 相比较而言,较为接近类群1(遗传特征值为0.261 3)和类群4(遗传特征值为0.245 9),2016-20 相比较而言,较为接近类群1(遗传特征值为 0.330 7)和类群3(遗传特征值为0.297 8),2016-21 相比较而言,较为接近类群1(遗传特征值为0.405 3)。但是,根据Admixture 各个K值的交叉验证错误率折线图走势及结果可以看出,K=1 是应为最优K值。因此,25 个不同生态类型的菘蓝样品群体关系为均来自同一个祖先。

图2 Admixture 各个K 值对应的样品聚类结果Fig.2 Sample clustering results corresponding to K values of Admixture

图3 Admixture 各个K 值的交叉验证错误率Fig.3 Cross verification error rate of Admixture for each K value

3.7 PCA

基于SNP,通过EIGENSOFT 软件,进行PCA,得到样品的主成分聚类情况和具体数据如图4 所示。通过PCA 三维聚类图可知,25 个样品的SNP结果聚为1 个分组,同时也佐证了“3.6”项群体结构分析的结果,25 个不同生态类型菘蓝为同一个祖先,拥有共同的血缘来源。

图4 不同生态类型菘蓝PCA 三维聚类图Fig.4 PCA three-dimensional cluster map of I.tinctoria of different ecological types

4 讨论

十字花科菘蓝属有7 种菘蓝,分别是长圆果菘蓝I.oblongataDC.、宽翅菘蓝I.violascensBunge、毛果菘蓝I.tinctoriaL.var.praecox(Kit.)、欧洲菘蓝I.tinctoriaL.、三助菘蓝I.costataC.A.Mey.、菘蓝I.tinctoriaL.、小果菘蓝等I.minimaBunge。根据《中国植物志》中记载的各种菘蓝形态特征描述,比对表1 中田间调查记录结果,结合对25 个不同生态类型菘蓝种植情况,可以排除不是宽翅菘蓝、小果菘蓝、毛果菘蓝、长圆果菘蓝、欧洲菘蓝和三助菘蓝,因为25 个不同生态型菘蓝均为二年生、茎及基生叶背面不带紫红色、植株被不具有白色柔毛、角果不着生柔毛和不具有中脉3 棱的特点,因此,可以确定此25 个不同生态类型的菘蓝是中国特有种菘蓝,与群体结构和PCA 的结果一致。根据表1 中叶片表观特征描述,25 个不同生态类型菘蓝可以分为5 钟类型,第1 种类型为倒卵圆形无缺刻皱缩叶(2016-27、2018-1),第 2 种类型为倒卵圆形缺刻皱缩叶(2016-2),第3 种类型为倒卵圆形无缺刻平坦叶(2016-3、2016-4、2016-5、2016-6、2016-14、2016-15、2016-16、2016-17、2016-18、2016-19、2016-21、2016-22、2016-26),第4 种类型为倒卵圆形缺刻平坦叶(2016-9),第5 种类型为披针形无缺刻平坦叶(2016-1、2016-7、2016-8、2016-13、2016-20、2016-23、2016-24、2016-25)。

分子生物技术是现代生物学研究不可或缺的技术手段。本研究利用SLAF-seq 技术在菘蓝全基因组范围内成功开发出了大量SNP 位点,利用得到的63 002 个群体SNP 标记分析了不同生态类型菘蓝种质的群体遗传多样性,根据SNP 群体遗传结构、PCA 及田间观测记录,25 个不同生态类型的菘蓝为同一种属,具有共同的祖先和血清来源。SNP 系统发育树将25 个不同生态类型菘蓝聚为3 类,第1、2 类对应田间观测调查的倒卵圆形无缺刻平坦叶,而第3 类涵盖了田间观测调查的5 种类型。在SNP群体遗传结构的分析结果中,2016-8、2016-17、2016-20 和2016-21 这4 个生态类型的游离在多个类群之间,每一个类型都出现同属于几个类群的现象,结合叶片表观特征调查的结果发现,这4 个类型的菘蓝均为倒披针形无缺刻平坦叶,并且种子的引种地并不在同一个省份和地区,说明2016-8、2016-17、2016-20 和2016-21 在市场流通比较频繁,为药农和种植户所常选类型之一,因此在频繁的引种交换过程中曾可能出现过与其他类群之间的基因交流,或者经受各地不同环境气候的自然选择,从而导致类群归类不具体的现象。

综上所述,不同生态类型菘蓝形态上的差异可能来源于种内遗传差异,差异的形成原因可能是由于菘蓝在国内各地都是采用种子直播的方式人工栽培,并且种子大多都是自繁自用或区域性调种,很少出现大范围的调种现象,但是我国东西南北气候和环境差异较大,因此菘蓝种群的种内基因大范围交流受阻,外加各地气候和环境对其的自然选择进化,形成了具有区域特点的不同生态类型,表现了菘蓝的遗传多样性。目前,根据现有结果和数据,可以将25个同一种属不同生态类型菘蓝分为倒卵圆形无缺刻皱缩叶、倒卵圆形缺刻皱缩叶、倒卵圆形无缺刻平坦叶、倒卵圆形缺刻平坦叶、倒披针形无缺刻平坦叶5 个类群。此研究为后期进一步研究不同类型菘蓝的基因来源和遗传进化提供参考,为菘蓝种质分类、品种鉴定和分子辅助育种提供借鉴。

利益冲突所有作者均声明不存在利益冲突

猜你喜欢
类群基因组遗传
非遗传承
牛参考基因组中发现被忽视基因
还有什么会遗传?
还有什么会遗传
还有什么会遗传?
薏苡种质资源ISSR分子标记筛选及亲缘关系分析
黑石顶自然保护区土壤动物功能类群对季节动态的响应
2011年春夏季黄海和东海微型浮游动物类群组成及其摄食的研究
基因组DNA甲基化及组蛋白甲基化
有趣的植物基因组