导读
野生植物被成功地驯化为农作物是人类文明的大事件。该过程的成功很大程度上要归功于持续的人工选择。本文总结了过去十年在作物驯化和育种研究中的新发现。作物基因组图谱的构建和众多性状控制基因的功能解析为科研提供了基础信息。在许多植物的研究中都正在应用读取、解读和改造复杂遗传信息的方法来高效地从头设计物种或对野生种进行重新驯化。了解作物微观进化的潜在机制,将其应用于农业生产,或将为未来应对粮食安全方面的挑战提供行之有效的解决方案。
原名:The integrated genomics of crop domestication and breeding
译名:作物驯化与育种中的整合基因组学
期刊:Cell
IF:66.85
发表时间:2022年5月
通讯作者:黄学辉,黄三文和李家洋
通讯作者单位:上海师范大学,中国农科院深圳基因组所和中科院种子创新研究院
DOI号: 10.1016/j.cell.2022.04.036
研究进展
1 引言
自从大约一万年前出现农业文明以来,人类一直对农产品有强烈的依赖。几十种植物的成功驯化为作物是农业文明的大事件,因为丰富的粮食资源是人类繁荣的重要基础。最典型的例子是:三大主粮作物水稻、小麦和玉米,目前养活了数十亿人。这些谷物分别独立起源于东亚、中东和中美洲,然后传播到世界各地,表明这些作物对人类社会具有广泛的价值。
驯化的作物与其野生祖先存在遗传差异。人类在寻求食物的生产活动中,有意识地驯化植物。植物与易于种植(如,直立的植物结构)、收获效率(如,在成熟时减少落粒)和吸引人的味道等特征相关的等位基因变异被特异地进行选择。在人类将这些驯化或半驯化的植物传播到更广泛的地理区域范围的过程中,那些具有适合不同环境(如光照时间、温度、水、土壤和微生物)的等位基因变异的植物种群在农民的有意种植下规模逐渐扩大。过去的驯化事件是对有利的自然变异进行固定化,这在栽培物种形成中是一个缓慢的过程。例如,根据考古观察,水稻、小麦和大麦中仅“减少落粒”这个表型的固定就经历了千年甚至数千年。相比之下,现代育种中的人工选择更加高效,水稻和小麦中半矮化等位基因的固定化仅用了几十年时间。植物遗传学和育种者需要追踪作物驯化和育种过程中的关键分子变化,以便指导作物的进一步改良或以更快捷的方式从头驯化野生植物,因为遗传育种遵循相同的原则——寻找或创制多样化的等位基因,之后进行自然或人工选择。
人类在确保充足的粮食供应方面,仍面临多重挑战。其中包括人口增长、耕地和清洁水的不足、气候变化、环境污染以及不可预测的其他危机,如当前的COVID-19大流行。保障全球粮食安全需要不断改进植物育种科技。基因组学技术的发展极大地促进了作物驯化分子基础的研究。在过去的几年里,基于解析和操纵植物基因组方面的科技的飞速进展,包括读取(各种组学技术)、解读(大数据的深度学习)和编辑改造(CRISPR-Cas9)等,在作物驯化和育种领域促成了诸多新的概念和发现。新概念和新发现在作物设计中的应用,包括新等位基因甚至新基因的基因工程,将加快未来育种的速度。本文总结了基因组学、群体遗传学、遗传图谱和功能基因组学在该领域取得的最新进展,并展望****未来****。
图1 | 作物驯化和改良的遗传方法。在解析基因组过程中,高通量技术的出现生成了大量组学数据。通过整合组学数据和各种遗传分析方法,可以揭示潜在的机制,包括识别驯化和改良相关基因及其调控途径。用于基因编辑的工具,如CRISPR-Cas9和合成生物学,将以高效的方式用于作物重新驯化和育种。
2 作物参考基因组测序
作物驯化和改良的遗传研究在很大程度上非常依赖相关植物物种的高质量参考基因组序列。在过去20年里,已经有数百种植物完成了测序、参考基因组组装,其中大部分已经达到染色体水平。作物基因组的爆炸式发展很大程度上归功于基因组分析中测序技术和相关算法的快速发展。目前,能够测到较长的序列(通常>10kb)的第三代测序(TGS)在生成作物参考基因组方面几乎完全取代NGS(短序列的大规模测序,读长通常为150-800bp)。具体来说,PacBio高保真测序所使用的CCS(circular consensus sequencing)测序技术能够读取准确读高达99.8%、平均长度为13.5kb的序列信息。此外,尽管纳米孔(Nanopore)测序技术的碱基准确度较低(约90%)存在缺陷,但其读取长度的优势(平均>20kb,最大长度超过2Mb)使该技术颇具吸引力。虽然简单地使用Pacbio高保真测序或纳米孔长片段测序即可实现高连续性的基因组组装,但结合“合成长读取技术”(例如,10xGenomics、Hi-C和Bionano光学图谱分析系统)可以减少组装错误、能更好地将序列定位到motif、组装到染色体上。除了测序技术的进步,研究人员还开发了许多算法和工具包,用于从头组装基因组,包括Canu、FALCON、Wtdbg2、NECAT和Hifiasm等,这些工具提高了序列组装的准确性并使获得的参考基因组的缺口更少。
最近,在应用这些工具的基础上,许多作物的基因组组装得到了更新升级。例如,玉米、小麦、马铃薯、棉花和花生。此外,最近,已经有研究者着力构建无缺口的端粒到端粒(T2T)参考基因组,这为被称为“暗物质”的染色体区域(例如,着丝粒和大型重复区域)的解析提供了新的见解。例如song等人组装了两个水稻品种的无缺口基因组,是作物(玉米)中组装的第一个无缺口基因组;在玉米中,Liu等人组装了两个染色体水平的无缺口基因组,揭示了旋钮状重复(knob repeats)的内部结构。
同源多倍体作物基因组由于亚基因组的极高相似性,解析难度较高。为了解决重建同源多倍体基因组的问题,Zhang等人开发了一种基于Hi-C的支架算法(All-HiC),该算法能够为多倍体基因组构建等位基因的识别、染色体规模的组装提供便利。该方法成功地应用于组装复杂的基因组,如同源四倍体甘蔗和同源四倍体紫花苜蓿。此外,已经设计了几种遗传方法用于构建染色体单倍型,例如三重组合、配子组合和重组后代的分离群体的基因分型。值得注意的是,基因组同线性分析表明,在同源多倍体物种的同源染色体之间可以检测到大量结构变异(SV),如大片段倒位等。
在“白金级”的作物基因组解析后,研究者不仅可以发现功能基因,还可以发现基因组变异。值得注意的是,通过机器学习简单地基于基因组序列即可预测到开放染色质、组蛋白标记和转录丰度等许多组学特征,暗示基因组中仍有大量信息有待探索、解析。例如,在玉米中,Zhou等人构建了一个模型,仅根据基因转录起始位点附近确定的基序即可预测基因在响应热应激时的表达趋势。对25个玉米组装基因组中具有顺式调节变异的基因的进一步分析表明,SV可能引起转录因子结合位点的存在或缺失,从而引起其应激反应发生改变。
3 从单一参考基因组到泛基因组
随着测序和生物信息学的升级,作物群体基因组学正在从单一参考重测序方法转变为线性泛基因组方法。最近又出现了图形泛基因组新方法。对于单一参考基因组的重测序方法,变异的识别高度依赖于序列相似性,从而将NGS短片段定位到参考基因组上,故而难以避免来自高度多态性区域的遗传变异的丢失。泛基因组是指存在于一个研究物种中的基因组序列的总和。早期的线性泛基因组由多个基因组组装或参考基因组与未能比对上的序列数据的附加序列的合并、组装组成。与线性泛基因组相比,基于图的基因组可以在将来自目标物种的多个基因组的复杂信息整合到同一个图中,并且可以用于后续的种群遗传分析。
泛基因组减少了参考偏差并涵盖了更多的变异信息,有利于下游遗传分析。特别是,SV通常富集在复杂的基因组区域,因此可以使用基于组装的变体调用策略以准确识别。相对而言,基于单一参考基因组、重测序获得的结果因为未比对成功的短序列及其组装通常准确度较低。
许多作物中均已构建泛基因组(图2A)。基于20个品种的染色体水平基因组组装构建的大麦泛基因组,极大地促进了大麦遗传学研究和育种。泛基因组中发现了大量的Mb碱基的倒位,其中一些被发现与最近的突变育种和适应性相关。在番茄中,Gao等人利用构建的泛基因组在风味相关基因TomloxC的启动子中发现了一种罕见的调节因子变异。Alonge等人在不同的番茄品系中捕获了238,490个SV,其中大量与基因剂量和表达水平的改变相关。在大豆研究中,构建了基于图的高质量泛基因组,用作对整个大豆种群的SV进行基因分型的参考。基于这些SV的全基因组关联研究(GWAS)解析了一个10-kb的SV,它可能与种子是否具有光泽相关的基因相关。在玉米中,Hufford等人从头组装了26个不同系的基因组,用于嵌套关联(NAM)作图,提高了NAM中遗传作图的能力。在水稻中,Qin等人使用基于图形的SNP和SV基因分型预估出17.5%的SV与相邻SNP的连锁程度较低,表明有很大比例的隐藏遗传变异尚待探索。在番茄中也观察到类似的现象,即SV与相邻SNP的连锁程度低。当将由番茄泛基因组图谱中鉴定的SV纳入考虑时,估计的遗传力增加了24%。尽管泛基因组正在成为作物基因组学研究的新参考信息,但它们相关的基因组注释情况(例如基因和转座因子注释)和基因组实用性(例如泛基因组浏览器和数据库)仍有待开发,以更好地支持作物遗传研究和育种。
4 作物群体基因组学
除了侧重于尽可能全面地解析基因组变异的泛基因组学,群体基因组学更关注解释这些变异的进化因素。在植物驯化过程中,基因漂移和人工选择等进化力量驱动了显著的基因组变化。根据基因组特征(包括多样性减少、频谱的偏移、单倍型纯合性扩展和显著的等位基因频率分化)已经开发了用于检测人工选择的方法。该方法是基于从基因组区域的中性变异部分识别多态性模式特征发生的变化。同时,研究者也越来越多的注意到许多农作物起源复杂,需要考古基因组学的更多证据。深入研究野生种群亚结构的多样性、不同野生亚种群对栽培群体的相对遗传贡献率、多样性下降的时间等因素,有助于更好地解析驯化过程和人类选择所针对的基因。
图2 | 过去十年中作物群体基因组学的进展。A|显示了每种作物在重新测序(主要通过短读测序技术)或泛基因组构建方法测序(主要通过长读测序)中的基因组覆盖率。B|通过对栽培植物及其野生祖先的全基因组重测序检测到的驯化Sweep区通常与遗传作图信号或克隆的驯化基因重叠(提供了作物中驯化基因的典型示例)。泛基因组有助于确定导致驯化变异的原因(以玉米tb1基因为示意图),并追踪群体的进化过程。整合多组学技术的方法将进一步促进相关分子调控网络的研究。
深度学习也已应用于进化基因组学,并且已经开发了一些方法用于检测选择特征。例如,开发了使用祖先重组图(SIA)的选择推理,来研究祖先重组图的特征,并推断有益变异的选择系数和等位基因频率变化过程。值得注意的是,这种基于深度学习的方法不仅可以检测和量化硬清扫(一个有益等位基因迅速增加其在整群体中的频率,其关联位点的变异急剧减少),还可以检测和量化软清扫(多个有益等位基因同时被选择并扫描群体)具有良好的表现。
当与“自上而下”实验(例如数量性状基因座定位作图QTL)相结合时,这些“自下而上”的方法变得更加强大,能确定负责驯化相关性状的基因,水稻、玉米、大豆和番茄等研究就是很好的例证。然而,值得注意的是,有许多基因座具有很强的人工选择信号,但与任何已克隆的驯化基因或遗传作图信号无重叠。这些选择信号可能是地理遗传特征,也可能是在栽培实践开始之前的很长一段时间内由未知的选择压力驱动的。此外,许多可能与人类的无意识选择有关的基因或功能元素仍有待探索。
群体遗传学除了研究二倍体作物外,还研究了大量多倍体作物,因为30%的栽培作物都属于多倍体。多倍体的遗传后果包括遗传多样性和杂合程度的提高,以及对新环境的适应性、可塑性的提高。Salman-Minkov等于2016年注意到与野生近缘种相比,作物物种中多倍体比例过高,并提出了“驯化后多倍化”的概念作为一个合理的假设:作物多倍化的遗传结果促进了它的成功驯化。与二倍体作物相比,在棉花、油菜和小麦等多种多倍体作物中,观察到了一些新的遗传模式,包括不对称的亚基因组选择等。对于无性繁殖的作物,如葡萄、木薯和马铃薯,尽管驯化已经改变了重要的农艺相关途径,但在驯化过程中,遗传漂变和育种系统的转变导致了有害突变的积累。值得注意的是,在杂合状态下,越来越多的有害等位基因被掩盖,因此需要在未来的育种计划中清除这些突变。
广泛的作物群体比较基因组学的进展正在促使研究人员分析作物适应人类选择的进化限制。尽管通常发现相似性状受不同基因控制,但不同作物品种在驯化过程中仍存在许多趋同进化的案例。Oryza glaberrima(非洲栽培稻)和O. sativa(亚洲栽培稻)分别由非洲和亚洲古代农民独立驯化,它们具有一些类似的“驯化综合症”,例如减少落粒性和的植物结构更直立化。Wang等人(2014年)和Wu等人(2017年)确定了亚洲栽培稻中已知的控制种子落粒性和植物结构等驯化相关性状的调控基因,这也是非洲水稻的人工选择目标。此外,选择还作用于亚洲和非洲水稻中的PROG1基因。葫芦中的非苦味是人类偏好的,在不同的葫芦品种培养中同步选择了该性状。Zhou等人(2016年)发现了一组调节苦味化合物(葫芦素)生物合成的转录因子,并发现在不同的野生葫芦品种驯化过程中,可能针对这些调节因子做出了趋同选择。种子休眠的丧失也是跨多种作物的共同驯化性状。在大豆中克隆了控制种子休眠的stay-green G基因,并在水稻中发现了其具有保守功能的同源基因。控制大麦芒光滑度的遗传基础被确定为与水稻LABA1基因同源,这两种基因都被人工选择之下、消除芒倒刺形成。鉴于禾本科中的许多物种是被人类驯化以提供碳水化合物的,Zhou等(2020年)收集分析了水稻、玉米和大麦中鉴定的选择相关的扫描区域的基因,发现它们与小麦同源的基因区域也富含驯化相关特征,这表明人类的选择导致谷类作物具备趋同选择的特征。
5 选择相关的重要基因
在过去的二十年里,植物遗传学和进化研究在识别人类选择相关基因方面已经做出了巨大的努力(图2B)。在驯化和现代育种过程中被选择的基因分别称为驯化和改良基因。一般来说,相关性状表现出连续的表型变异,并由多个数量性状基因(QTG)控制,这些基因可以通过基于图谱的克隆或GWAS来识别。此外,通过整合群体遗传学和多组学数据,可以通过探索研究有关这些基因的选择过程和功能的更多细节。
驯化是人类对植物进行选择的初始阶段。一些影响较大的QTG在驯化过程中被强烈选择并在作物基因组中固定下来。例如,种子落粒性、植物结构和花序结构是作物最重要的驯化目标。在几种主要谷物中,已经鉴定到控制这些性状的QTGs,例如tb1、PROG1/RPAD、SHAT1-5和Brt等。除了这些QTGs,其他与种子相关性状有关的QTGs(包括种子休眠、芒、种壳颜色、种皮颜色、裸粒和味道等)也是驯化的主要目标。在水果和蔬菜作物中,味道和风味是重要的驯化目标。例如,黄瓜中Bt基因的选择产生了不苦的葫芦科瓜果,而西瓜中ClAGA2的选择产生了甜果肉。
在少数特定地区发生的驯化后,作物不断得到改良并在全球范围内广泛传播。在扩散期间,在不同地区农民继续进行人工选择,以使作物适应当地环境。在光周期敏感作物中,光周期相关基因是主要选择目标,几乎所有主要的开花相关QTG都经历了适度程度的人工选择。在水稻中,选择了Ghd7、DTH8、Ghd7.1和Hd1,使得原始的短日照植物也能在高纬度地区长日照条件下开花。同样在玉米中对ZCN8、ZmCCT和ZmCCT9进行选择;在大豆中J、Tof11和Tof12被选择,促进了它们在热带或温带地区的传播、分布。对光周期相关QTG的选择促进了水稻、玉米和大豆的种植范围扩展到全球。
在现代育种中,作物产量通常是最重要的目标之一。对fw2.2、lcn2.1、fw3.2和其他QTGs的选择促使现代番茄果实的大小比樱桃番茄增加了10倍以上。杂交育种已被广泛用于许多作物,利用杂种优势提高产量。在杂交育种过程中涉及和选择了许多杂种优势基因和杂交不育基因。数量遗传学和群体遗传学分析表明,在杂交水稻中集中选择了几个与开花时间和植株结构相关的基因,促成了产量杂种优势。特别是,基于开花时间的SFT和基于植物结构的IPA1可能分别是番茄和水稻中重要的杂种优势相关基因。鉴定水稻中的S5和qHMS7等杂种不育基因有助于打破生殖障碍,并有助于利用远缘杂交获得杂种优势。
总体而言,QTGs的驯化和改良为杂交育种提供了有价值的信息,也促进人们对作物微进化的一般机制的理解,以及对未来育种的实质性目标的理解。QTG相关信息和潜在的分子机制也为新作物的从头驯化铺平了道路。
6 连锁拖累和上位性
在作物育种中,种质资源的收集经常被用作宝贵的资源,但连锁累赘是一个常见的障碍。连锁累赘(也称为遗传累赘)是指与育种者试图渗入的基因紧密相连的不良基因。基于水稻数量性状图谱,在约25%的水稻基因组中都检测到潜在的连锁累赘。水稻有两种主要的连锁累赘:一种是与稀有而有价值的基因紧密连锁的劣等基因,另一种是在两个亚种中出现高度分化的相邻基因。在番茄抗病育种中,使用了许多野生等位基因,如 Mi-1、Ty-1和Sw-5,大量外来片段随着这些野生基因渗入到这些抗病品种中。野生等位基因的连锁累赘是固定的,难以打破,可能是染色体倒位造成的。水稻和番茄的研究结果表明连锁累赘可能是野生种质资源利用中的一个常见障碍,因为野生植物基因组可能包含许多与未驯化基因相关的所需抗性基因。因此,需要特意打破这种联系:渗入理想的基因,避免紧密连锁的不良基因。为了实现这一目标,连锁累赘的基因组格局、高密度基因分型的使用以及智能育种系统的开发都需要在育种群体中追踪重组事件,以排除高度连锁和劣等基因,如基于不同二倍体马铃薯基因组组装的大型倒位图的构建,为排除潜在的连锁拖拽提供了重要参考信息。特别是,CRISPR-Cas9技术可用于重组植物染色体,包括介导目标区域的大规模倒位或诱导异源染色体间染色体易位等,都有可能打破或修复植物育种中的遗传连锁。
过去驯化导致的一些作物存在一种特殊类型的连锁累赘,位于Sweep区。基于表型的驯化在基因组空间分析方面存在一些缺陷。驯化选择了优选的等位基因时,不可避免地会选择一些额外的、与目标等位基因高度连锁的基因组片段,这个过程被称为“搭便车”。在西红柿中,Sweep区可达111Mb,占基因组的14.2%,有时会导致意想不到的结果。例如,fw11.3的基于果实质量的选择导致数十种代谢物发生变化,这在很大程度上是由sweep区域内的连锁基因引起的。这些sweep显著缩小了进一步改进的空间。如今,基于基因的选择和基因组编辑可以提供新的策略来释放这些在驯化中产生的基因组空间。
除了连锁累赘外,上位性也存在类似的情况。将两个靶基因放在一起对表型的影响效果并不总是像做加法那样简单。在番茄研究中,由于两个转录因子之间的遗传相互作用,将两个独立选择中表现有益的基因叠加在一起,会导致分枝和不育等不良表型,这表明育种中还需要绕过负上位性基因。不幸的是,在大多数作物中,目前关于上位性相互作用的信息非常有限。更多全面检测和定量评估作物基因组中这些上位性相互作用的遗传学研究对于指导作物育种将是大有裨益的。
7 创制新等位基因
过去的驯化依赖于人类长期艰苦的选择、适合作物种植中自然发生的突变。现在基因组学技术的进步和重要作物基因的发现加速了育种选择并促进研究者设计理想的作物。基因组编辑,主要使用CRISPR-Cas9技术这个强大的工具,有效地为作物育种目标操纵各种等位基因,包括劣质基因的敲除和调控基因的微调。在感兴趣基因的编码区内进行移码插入缺失突变,是基因组编辑中最常见的操作。这种敲除突变体可能会出现极端的表型变化,这在基因功能验证中很有价值。但是,对于遗传改良,重要基因的功能丧失等位基因常常不能产生理想的表型。许多驯化突变属于“弱等位基因”或“数量等位基因”类型。例如,几乎所有栽培稻种都含有sh4这种减少种子落粒性的缺陷的等位基因——驯化过程中,第一个外显子中发生G到T突变并被固定下来,sh4的基因功能在栽培水稻中并未完全丧失,而sh4的移码突变体则完全消除了落粒性相关的发育,导致产生完全不落粒表型。
在蛋白质编码区进行碱基编辑是一种创建新等位基因的方法。例如,编码颗粒结合淀粉合酶I的Waxy(Wx)是影响谷物食用和烹饪质量的主要水稻基因。通过对编码区进行精确的碱基编辑、产生多个新Wx等位基因,达到了微调稻谷中的直链淀粉含量的目的。类似的方法已应用于OsACC1和OsALS1的人工进化,以提高植物对除草剂的抗性。在CRISPR-Cas9基因编辑中使用多个目标引物、在启动子区域内进行删除编辑(Indel),是另一种生成多种等位基因的方法,可以通过编辑顺式元件来改变基因表达水平或模式。这种方法首先在西红柿中进行了尝试,产生了许多启动子变体,用于果实大小、花序分枝和植物结构的遗传改良。后续在其他作物上的成功应用表明它是促进农艺性状改良的有效方法。
基因组编辑也能够产生大的缺失。在小麦中,TaMLO1基因敲除品系表现出对白粉病的广谱抗性,但存在生长缺陷。而一个304-kb的缺失则可导致TaTMT3B激活、保持植物生长和产量,同时赋予强大的抗性。因此,同时编辑TaMLO1基因和所需的大缺失可以在没有影响生长的情况下实现抗病性。这些发现强调了基因组编辑是植物育种中实现快速创新的有力策略。
8 从头驯化和基因组设计
栽培作物是从生长在人类文明起源附近的野生植物中驯化而来的,而在未来,有可能使用现代工具对更多的野生物种进行驯化。由于许多驯化基因的鉴定和新工具的开发,基因组规模的从头驯化在技术上变得可行。以基因组工程为目标,通过同时操纵多个基因、从头驯化野生植物或重新驯化现有作物的野生祖先,正在使用基因组编辑、基因组设计或合成生物学等方法实施(图3)。CRISPR-Cas9技术在从头驯化中非常强大。近年来,基于图位克隆和GWAS,驯化相关基因的知识得到了极大的扩展。此外,如上所述,已经确定了几个重要的基因、揭示了作物驯化中的趋同进化模式。因此,随着发现不同植物中的同源基因通常控制相同的性状,编辑关键节点中的基因可能会在重新驯化中发挥很好的作用。事实上,通过在野生植物中进行基因组筛选、编辑多个驯化基因的同源基因,已经证明了这种策略的有效性(图3A)。例如孤生作物、地樱桃和野生番茄等,因为它们在抗病性和耐盐性方面的优势而被选中用于人工驯化。
图3 | 通过同时操纵多个基因进行作物再驯化和育种的基因组工程方法。A|对驯化基因进行基因组编辑,以快速驯化四倍体野生稻、野生番茄图中显示了基因组编辑中使用的基因。B|基因组设计策略用于创制二倍体马铃薯F1杂种。圆圈内的标签“3”和无圆圈的“3”分别表示自交和杂交。SI和DM分别是自交不亲和和有害突变的缩写。C|作为对未来的展望,C4植物玉米光合作用的模块通过合成生物学途径提高大豆的产量。
一个单子叶植物的例子是四倍体野生稻,它被设计用于创造新的谷类作物,以获得更大的生物量、对气候变化适应性更强。异源四倍体野生稻(Oryza alta)是一种来自南美洲的野生稻种,含有许多可用于农业的表型。为便于野生植物的从头驯化,已经建立了高效的组织培养和转化系统、组装成了具有高质量基因注释的染色体级基因组。在栽培稻中,已鉴定出许多驯化或改良相关基因。从野生稻基因组中搜索了六种重要农艺性状基因的同源基因,并选择基于CRISPR-Cas9的诱变。研究发现大多数用于基因组编辑的基因在栽培稻和野生稻之间相当保守,和预期一致,这些性状在可以被迅速驯化。这些研究表明,野生植物可以被高效地成功转化为类作物物种,这为利用野生近缘种和未驯化植物中的无数基因打开了大门,也为未来的植物育种计划赋予了重要的特征。杂交马铃薯育种,将其从无性繁殖的四倍体作物改造成二倍体种子作物,将彻底改变马铃薯产业。自交不亲和和近交衰退是阻碍杂交马铃薯育种的两个主要障碍。自交不亲和的障碍是通过鉴定马铃薯中的自交亲和基因来解决的。由有害的隐性突变引起的近交衰退则是马铃薯育种的第二大障碍,是更大的挑战,但其中的遗传基础已被破译。这些有害突变在马铃薯不同品系中具有品系特异性,表明具有不同遗传背景的自交系之间的杂交将掩盖大多数有害等位基因突变的不良影响。最近的一项研究中,通过基因组编辑产生了二倍体马铃薯的自交系,并使用基因组辅助选择来识别和清除这些主效应有害突变(图3B)。这种策略通过基因组设计,可以将马铃薯育种从缓慢的、非累积的模式转变为快速迭代的模式,从而使应用F1代杂交种进行马铃薯育种成为可能。对水稻的研究方向则与马铃薯的策略完全相反——使杂交水稻变成为克隆繁殖的作物。水稻中同时针对几个减数分裂和受精基因进行遗传工程操作可以导致通过孤雌生殖途径进行无性繁殖,这可能使水稻杂交系能够产生具备杂种优势的种子。这种策略可以改进并扩展到其他作物,在后代中,继续保持杂交F1代中的高产量特征。合成生物学的最新进展也为植物基因组设计新的生物学功能提供了强大的工具(图3C)。例如,将新的光呼吸旁路引入水稻叶绿体,或在玉米中过表达Rubisco大小亚基及其组装伴侣RUBISCO装配因子(RAF1)作为完整结构,均极大地提高了作物的光合效率和粮食产量。这一策略也已应用于提高作物的营养质量。例如,通过对类胡萝卜素途径进行复杂的工程改造,在番茄果实中产生了一种可再生的高价值色素“酮类胡萝卜素”。在另一项研究中,设计了一种新的代谢途径并将其添加到水稻基因组中,使用包含8个花青素相关基因的重组载体,最终,创制了具有花青素含量高并具有抗氧化活性的胚乳的水稻新种质。合成生物学在作物害虫防治方面也非常有效。在最近的一项工作中,通过利用烟草中的遗传种群和多组学方法,从叶片中鉴定出一种对叶蝉害虫具有抗性的挥发性化合物。解析这种化合物的生物合成途径后,设计了合成生物学方法来重建番茄和蚕豆中的化学物质以进行作物植保。此外,随着对天然橡胶生物合成机制的了解,合成生物学可能会在改进或创造产橡胶植物方面发挥重要作用。这些展示了合成生物学在作物设计育种中创制特异模块方面的潜在应用。
展望
广泛收集不同遗传资源对作物遗传改良具有重要意义。遗传学研究表明,驯化相关等位基因也存在于野生种群中,但频率较低且分散在不同的种质中。驯化和现代育种都是通过寻找有益等位基因、富集多个目标等位基因加速进化的过程。野生资源以及适应当地环境的地方品种均具有丰富的遗传多样性,并且包含许多天然的、对作物栽培有益的等位基因。目前,世界各地的种质资源库(通常称为基因库)中保存着数百万种植物种质。正如大麦研究中证明的,基因库基因组学勾勒出了未来利用这些种质的方向。随着测序成本的不断降低,几乎可以对基因库中的所有种质进行全基因组低覆盖测序,并对所有核心种质进行高质量的基因组测序。通过对植物遗传资源进行系统的基因组数据分析、结合表型数据分析,研究人员将能够解析出适应气候变化和环境挑战的关键等位基因。此外,由此产生的基因组-表型数据库,以及数据和种子,可以通过共享使用协议,在全球范围内用于基因组设计育种,共同解决全球粮食安全问题。植物驯化和育种有赖于通过染色体重组将来自不同种质的多个有利等位基因进行整合或者创制一个全新的基因组。尽管一般来说,重组事件并不受控制,但一些调节减数分裂交叉的基因可能具有提高交换数量的潜力。此外,表观遗传修饰有可能改变减数分裂交换的分布。这些对于育种者来说是重要的发现,因为由于重组率低,着丝粒附近的有害突变很难去除。因此,控制重组的工具(增加重组数量、微调重组模式)以及其他广泛使用的育种技术(例如基因组选择、单倍体诱导和快速育种),都将有助于提高作物改良的效率。人工智能(AI)正在成为作物遗传研究和育种的强大工具,用于精确表型分析和组学数据挖掘。通过基因组设计或基因组编辑定制的新植物需要通过高通量方法进行筛选,以对目标性状进行表型分析。人工智能可用于在特定条件下有效选择复杂、多变环境中数量巨大的育种群体。育种者使用无人机(UAV)和各种传感器来捕捉田间作物的图像,可以获得海量的表型数据,以进行高效和全面的分类。除了用于表型分析,随着测序成本的不断降低和大规模组学数据的爆炸式增长,现在可以使用深度学习来挖掘生物信息。现有深度学习模型的扩展为探索生物调控和DNA中解析生物遗传密码提供了一个平台。未来,随着人工智能的进一步发展,各种植物的组学数据将用于解析基因调控网络,指导基因编辑,加快植物育种步伐。长远来看,要点就在于解决物种间基因资源互相隔离的局限性,并将不断增加的新型分子模块谱添加到目标作物中。例如,随着对C4光合作用潜在分子机制的深入了解,可以通过发现和重塑控制Kranz发育、形成及CO2浓缩相关的关键基因,使C3水稻或C3大豆重新驯化为C4植物(图3C)。结合作物的另一个关键生物过程固氮模块,拥有超级作物的新时代可能从梦想变成现实。
网友评论