完整基因组序列是一个物种研究的新纪元。从人类基因组计划的完成,到现在的基因组测序已经从重要作物、猪马牛羊走向各种飞禽走兽、鱼虾蟹贝、奇花异草,基因组测序似乎已经到了大爆发的时代。但单一物种基因组测序的文章似乎越来越难冲击Nature、Science、Nature Genetics等顶级期刊。与此形成鲜明对比的是,跨种、属、科甚至更高分类尺度的大规模物种基因组测序和进化研究的文章却频频见刊Nature和Science。从2016年76种硬骨鱼,到2018年13种稻属物种、81种蠕虫等文章在Nature Genetics发表后,2019年更是有反刍动物、蝴蝶、鸟类等多篇文章发表在Science,让我们看到了动植物基因组研究的新模式。
经典案例速览
01
2020年1月,美国印第安纳大学等单位对代表节肢动物5亿多年进化过程的76种节肢动物基因组进行测序和分析,分析了在节肢动物进化早期和昆虫向现代多样化过程中出现的新基因家族,揭示了节肢动物DNA甲基化模式的意外变化,以及与显著的表型和生理适应相关的基因家族和蛋白质结构域进化。
76种节肢动物基因组测序研究策略[1]02
2019年6月,西北工业大学等单位对代表六个反刍动物科的44种反刍动物基因组进行了从头测序,结合已发表的7个物种基因组,创建了时间校准的系统发育,进行了群体动态分析,揭示了可能与反刍动物消化系统、头盖骨附属物、免疫系统、新陈代谢、体型、奔跑运动和牙齿发育有关的基因和调控因子。
51种反刍动物基因组测序研究策略[2]03
2018年11月,国际蠕虫基因组联盟对81种蠕虫基因组进行了广泛比较研究,分析了系统发育的关键节点上与寄生有关的基因家族,揭示了药物开发的核心代谢和蛋白质家族中广泛的谱系特异性差异。
81种蠕虫基因组测序研究策略[3]04
2018年1月,冷泉港实验室等单位对13个稻属物种基因组进行从头测序,分析了不同基因组类型稻属物种的进化关系和种群历史,新基因组元件的系谱特异性出现对物种快速多样化的影响,不同进化尺度基因家族的进化特征以及抗病基因的进化机制。
13个稻属物种基因组测序研究策略[4]研究思路总结
基于大规模跨分类群物种的基因组测序,可以从系统发育、分化时间、基因组结构进化、基因和基因家族进化等不同层面为揭示物种进化的遗传基础和机制。
1 基因组尺度的系统发育
明确系统进化关系是物种进化研究的关键。相比于利用核型或基因序列,物种完整基因组序列可以为物种系统进化关系提供更完整和可靠的信息。上述对反刍动物的研究中,分别使用直系同源共线性序列、同源蛋白编码基因、4倍简并位点、保守非外显子元件、完整线粒体基因组序列构建全基因组系统发育树,同时使用联合的系统发育方法ASTRAL和MP-EST构建基于窗口的基因树(WGTs),解决了反刍动物缺乏完整系统发育及部分谱系存在争议的问题。例如,之前基于线粒体DNA的系统发育学将叉角羚科列为所有其他叉角羚科的外群,而上述分析确定了叉角羚科和长颈鹿科的姊妹群关系;在一些线粒体DNA研究中,麝科被认为是鹿科的姊妹群,而上述分析证实了麝科是牛科的姊妹群。
反刍动物系统发育[2](图片引自原文)2 种群历史动态
群体规模的跨分类物种的基因组序列为了解物种进化过程中的种群动态提供了可能。上述反刍动物研究中,基于全基因组序列,使用PSMC方法分析不同反刍动物的种群历史,发现许多物种的种群数量下降始于大约10万到5万年前,表明晚更新世大型哺乳动物的种群数量下降比之前的推测要严重得多,而反刍动物数量下降的开始与这一时期不同大陆上人类的顺序扩张相吻合。
反刍动物的种群动态[2](图片引自原文)3 基因组重排
连续进化尺度上的物种完整基因组序列比较可了解不同物种中基因组重排的发生过程。例如,上述对13个稻属基因组利用共线性图谱和全基因组比对,发现外群物种L. perrieri 与O. sativa相比存在5个或更多基因的染色体倒位,其中一个倒位为AA型基因组特异的。对反刍动物的共线性分析也发现,鲸偶蹄目中猪和骆驼比虎鲸经历了更多的基因组重排,而在黑麂和山羊之间观察到很少的重排,表明反刍动物的不同谱系之间的共线性是保守的。
共线性分析揭示AA型稻属基因组中的一个特异倒位[4](图片引自原文)4 基因组结构进化
基因组结构,特别是重复序列和插入缺失等的含量是基因组大小变异的主要原因。对不同进化节点物种基因组结构的比较可深入了解基因组进化的特征。例如13个稻属基因组中长末端重复反转座子 (LTR-RTs)的比较注释和系统分析鉴定出几种血统特异的转座爆发,在BB 型物种 O. punctata内特异扩增的六个家族占25 Mb (基因组的6.3%),在8个亲缘关系最密切的AA型物种中,追踪到75个同源的LTR-RT位点,这些发现强化了TEs是基因组进化的重要驱动因素的观点。
稻属基因组中LTR-RT插入的丰度和年龄分布[4](图片引自原文)5 基因家族进化
对不同进化地位的基因组进行基因家族分析,可以揭示各进化尺度基因家族的特征以及在进化上的差异。例如对13个稻属中鉴定到21448的基因家族,这些基因家族可以分为四个年龄段:被子植物、禾本科、稻属和物种特异基因家族,这些不同进化尺度的基因家族具有不同的进化速率、基因组分布和表达水平差异,并涉及不同的生物功能。
稻属中不同年龄基因的进化差异[4](图片引自原文)6 物种适应性研究
研究物种特异性性状有助于了解物种形成过程中的适应性机制。例如,上述81种蠕虫基因组研究中,从无酪氨酸酶域家族的扩张研究揭示了使寄生虫能够通过宿主组织迁移,或者让寄生虫进食寄主感染过程中的互作机制。上述13个稻属基因组的研究中,对核苷酸结合高亮氨酸重复(NLR)受体基因的分析揭示了稻属物种进化过程中抗病增强的机制。上述51种反刍动物研究中,研究了多室胃、头饰、体型、奔跑运动和牙齿的演变和进化机制。
反刍动物特异性状的基因组特征[2](图片引自原文)参考文献
1. Thomas G W C, Dohmen E, Hughes D S T, et al. Gene content evolution in the arthropods[J]. Genome Biology, 2020, 21(1): 1-14.
2. Chen L, Qiu Q, Jiang Y, et al. Large-scale ruminant genome sequencing provides insights into their evolution and distinct traits[J]. Science, 2019, 364(6446): eaav6202.
3. International Helminth Genomes Consortium. Comparative genomics of the major parasitic worms[J]. Nature genetics, 2019, 51(1): 163.
4. Stein J C, Yu Y, Copetti D, et al. Genomes of 13 domesticated and wild rice relatives highlight genetic conservation, turnover and innovation across the genus Oryza[J]. Nature genetics, 2018, 50(2): 285-296.
5. Edelman N B, Frandsen P B, Miyagi M, et al. Genomic architecture and introgression shape a butterfly radiation[J]. Science, 2019, 366(6465): 594-599.
6. Sackton T B, Grayson P, Cloutier A, et al. Convergent regulatory evolution and loss of flight in paleognathous birds[J]. Science, 2019, 364(6435): 74-78.
网友评论