泛基因组及其在植物功能基因组学研究中的应用

2021-12-06 13:18潘佳颖
花卉 2021年14期
关键词:遗传变异基因组学变异

潘佳颖

(东北农业大学,黑龙江 哈尔滨 150030)

植物育种核心物质基础是控制农艺性状遗传变异,如何从广泛种质资源中利用优异遗传变异是植物育种研究的重要课题。现代基因组学技术发展是植物功能基因组学研究的核心动力,高质量参考基因组为遗传变异发掘提供统一标准框架。最高通量基因组学,转录组测序等技术为遗传变异发掘提供高效技术手段。随着对多样性植物资源研究,单一参基因组不能代表资源所有遗传变异,对多样性资源基因组研究易出现错误,难以有效鉴定基因中结构变异。拷贝数变异等结构变异在作物品种间普遍存在,基因组结构变异导致物种个体间基因结构等发生实质性变化。为完整描述群体遗传变异,科学家提出泛基因组概念,为功能基因组学研究提供参考框架。植物泛基因组研究成为植物基因组学研究热点。

1 植物泛基因组研究

泛基因组概念源于微生物基因组学研究,通过研究细菌基因组发现不同菌株存在大量基因缺失变异,Tetelin 等首次提出泛基因组概念,迅速用于动植物等生物基因组学研究中。目前构建包括大豆等20 多种真核生物泛基因组。泛基因组功能型定义以功能为核心研究对象,指群体所有功能基因总和。通过泛基因组研究群体功能基因分布,呈现群体功能基因,可以从基因拓展至基因家族。

结构性定义为对群体基因组序列比较分析,微生物组研究以基因为核心泛基因组定义应用较多,序列为基础泛基因组定义适合真核生物研究。泛基因组包括核心与非必需基因组,核心基因组指存在所有个体基因,核心基因组基因包括维持物种存活所需基本生理功能基因,如维持DNA 复制等功能[1];非必需基因包含群体全部可变基因,很多物种存在大量非必需基因组,拥有本文少的外显,如非必需基因非同义比例高于核心基因组,大部分非必需基因组与微生物多样性有关,基因功能主要富集于生物胁迫、植物发育等生物学功能。

基因组学是20 世纪90 年代兴趣的研究领域,功能基因组是利用结构基因组学提供信息,通过基因全面分析功能,使生物学研究转向对多个基因系统研究。泛基因组最早应用于转座子研究,目前超过16 个植物物种建立泛基因组,包括小麦等重要农作物。植物群体中非必需基因数量庞大,如油菜泛基因组中38%为非必需。木豆泛基因组组装1900 多个参考基因组不存在新基因,功能富集于生物学功能中。非必需基因是控制植物重要农艺性状的功能基因,有利于功能基因鉴定。

2 泛基因组组装方法

目前泛基因组以新测序数据为基础进行组装构建。策略分为对所有材料进行基因从头组装;以已有参考基因组为基础,通过对比—组装迭代进行构建;基于变异图组装。不同组装策略具有不同优缺点,植物泛基因组构建面临挑战是结构变异序列正确组装。对每个材料进行基因组从头组装方法,可以解决重复序列组装问题,有利于结构变异发掘鉴定。缺点是基因组从头组装费用高,难以大规模实施[2],不能解决大结构变异解析问题。

以参考基因组为基础迭代组装策略,对不能比对测序数据组装,如不能采用迭代法,可以运用类似宏基因组组装策略,组装得到泛基因组,实现基因PAV 分析。策略优点是技术相对简单,缺点是难以解决重复序列组装,不能很好地对大结构变异解析。基于图论组装法把基因组分为若干部分,可以通过变异图谱进行分析。泛基因组图提供新的概念,应用理论技术尚不成熟。相对线性基因组概念,泛基因组图适用于变异数据组织,具有广阔应用前景。目前多数植物泛基因组构建基于二代测序技术组装,应用基于参考基因组策略难以解决重复序列造成组装错误[3]。碎片化问题影响在结构变异鉴定中的应用效果。

PacBiO 等长读长基于单分子测序三代测序技术得到广泛应用,三代测序具有长读长优点,可以解决序列组装问题。在光学图谱等技术下实现高质量基因组组装,可以组装质量更好的泛基因组。基于三代测序进行泛基因组组装法成功用于大豆等植物范基因组构建中,组装策略选择是泛基因组组装重要问题。从头组装策略费用较高,导致构建泛基因组多样性不足等问题。迭代组装利用二代测序数据组装,可通过分析个体提高泛基因组多样性。但泛基因组完整性较低,选择群体中少数代表性材料从头组装,结合大规模多样性材料二代测序数据对比,是构建高质量泛基因组的可行策略。

3 泛基因组的应用

植物进化是植物基因组学研究的重点,解析植物进化基因组结构变异,有助于为植物育种提供线索。泛基因组结构变异捕获具有独特优势,可以为植物进化提供宽泛基础数据。如大豆种皮颜色为驯化重要性状,由于查尔酮合成酶基因结构变异导致野生大豆黑皮演变为黄皮。研究通过大豆野生资源构建泛基因组发现基因结构变异,分析泛基因组单倍体型剖析大豆种皮颜色驯化历史。

Sariel 等构件向日葵泛基因组,通过泛基因组进行同源基因比较分析,印证现代向日葵品种抗病性改良基因来源。利用控制主要农艺性状是植物遗传改良的基础,常规方法通过比较典型材料基因组结构,新测序技术为遗传变异分析提供高效技术手段,目前多以单一参考基因组为基础,不适用于基因组结构变异引起表型遗传分析。泛基因组可通过完整捕获群体全部遗传变异,提供完整的基因组参考消息。为GWAS 等技术应用遗传变异分析提供数据。泛基因组矫正单一参考基因组分析导致偏差,多样性测序数据对比单一参考基因组出现系统性偏差,参考基因组缺失序列读序数被丢弃。由于泛基因组包络群体完整基因组多样性,避免高度多态性读数丢失问题。

目前开发多个新测序数据对比方法,基于范基因组测序数据分析成为基因组学研究重要方法。泛基因组可以提高GWAS 准确向,GWAS 分析参考基因组不存在功能基因表型,出席县实际功能基因偏差较大情况,如GWAS 鉴定玉米米抗甘蔗花叶病毒功能基建营,以B73 参考引资加纳定SPN 关联分析检测功能相差8.5Mb,泛基因组以结构变异与SNP 为基因型数据,解决单一参考组导致GWAS 结果偏差问题。非必须基因组与很多农艺性状关联,通过泛基因组分析非必需基因,对鉴定抗功能性基因应用具有重要价值。

4 泛基因组在植物研究中的应用

功能基因组学研究是利用结构基因组学提供信息,使生物学研究转向对多个基因同时系统研究。主要采用比较基因序列方法,植物功能基因组是植物后代基因研究核心内容,特点是采用高通量实验方法进行研究。目前功能基因组学研究包括高通量遗传转化鉴定系统、获得DNA 芯片基因转录图谱等。人们建立系列有效的技术方法对功能基因组学深入研究,包括表达序列标签、插入突变等。

基因表达分析系列是快速研究基因表达的新技术,鉴定基因组中95%的基因,通常为9~10bp 寡核苷酸序列,通过连接酶将多个标签随机串联,可以显示各SAGE 标签代表基因特定组织表达,可保留基因表达数据,研究细胞转录变化引起生物现象。日本科学家Matsumura 等人首次利用SAGE 技术研究高等植物全基因表达定量,Fizames 等人用SAGE 技术分析拟南芥根基划分基因表达,通过获得SAGE 标签与已知基因对比分析,通过对不同状态下表达图谱比较发现基因表达差异。

现有转基因食品分析检测技术适用范围不同,需要进行相关分析检测技术研究。研究对异源四倍体野生花生进行基因组组装,对基因组进行区分得到亚基因组。异源四倍体植物具有两个亚基因组,Bertioli 等发现基因组与栽培花生AB 基因组序列相近,可以对鉴定抗病基因等问题提供帮助,为选育适应性强花生品种奠定基础,对花生树进化提供科学参考价值。

5 泛基因组应用研究展望

目前泛基因组领域需要解决更好地把最新测序技术及数据技术用于泛基因组组装,构建高质量泛基因组等问题。泛基因组组装广泛应用三代测序技术,解决大规模群体稀有遗传变异捕获问题需要开发相应技术流程。人工智能技术在泛基因组组装应用,有助于解决组装功能研究的挑战。如何更好地解析泛基因组变异数据是应用研究面临的挑战。

泛基因组应用研究核心是构建合适的数据框架,通过泛基因组呈现群体内结构变异。基于图论泛基因组数据结构化是目前研究热点。大豆泛基因组构建利用相关技术构建基于图泛基因组,目前相应技术算法不成熟,利用泛基因组图用于生物信息学分析,需要复杂的计算,开发完整的泛基因组数据分析流程,是未来泛基因组应用研究重点。随着基因组学技术的发展,单一参考基因组不能适应现代功能基因学研究需要,泛基因组可以为功能基因组学研究提供基础变异数据,构建泛基因组推动功能基因组学研究发展。

6 结语

目前植物功能基因组学研究取得一定进展,反向遗传学处于大量突变群体建立初级阶段。林木功能基因组研究主要研究对林木响应逆境胁迫研究较少,林木功能基因组学研究需要开展广泛国际合作。随着水稻基因组研究深入,可提供植物基因序列信息、基因功能信息等更多,为植物分子改良提供有效的技术支撑。

猜你喜欢
遗传变异基因组学变异
基于宏基因组学方法分析化肥减施对热带地区菜地土壤微生物群落的影响
武汉市园科院“莲基因组遗传变异与表达数据库”数据信息被国家基因库收录
山西在谷子功能基因组学研究领域取得重大突破
变异危机
变异
基于改进遗传变异算子的海岛算法
本草基因组学
肝纤维化无创诊断的研究现状
变异的蚊子
用毛细管电泳检测牦牛、犏牛和藏黄牛乳中β-乳球蛋白的三种遗传变异体