美文网首页
基因组学深入挖掘·研究方案(上篇)

基因组学深入挖掘·研究方案(上篇)

作者: iBioinformatics | 来源:发表于2023-01-10 22:00 被阅读0次

    自20世纪末人类基因组被破译以来,整个生命科学研究至今都处在“基因组浪潮”中。人们对生物的认识不再是简单依据实验观测和描述,而是能够通过基因组数据系统的深入解析内在规律[1]。近年来,随着测序技术的不断发展,科研工作者能够更快更便捷的获得更完整、质量更高的基因组参考序列,使得基因组的研究不再是“奢侈品”。早期较为“粗糙”的基因组正不断迭代更新,而超大、超复杂物种也已逐渐被国内外学者一一破译。同时,品种化、细致化、多样化的研究需求,使得动植物基因组研究进入泛基因组时代。

    基因组研究技术可为动植物序列多态性、物种栽培与驯化、基因定位、基因编辑、精细育种等提供精准信息。破译基因组已逐渐成为一种基础且必要的研究,但是如何才能对基因数据深入挖掘,又如何展开研究呢?

    为了能更好的服务动植物基因组学上的研究,本次以系列高分文章作为切入点,以基因组为基础结合转录组、代谢组、表观遗传、群体分析等多组学手段,整合最新多基因组联合分析方式,通过相应的方案设计及研究方法进行概述。拟通过文中的方案适用范围、分析流程及方法优势上让更多基因组学相关研究者寻找到最适合自己的路径。

    方案一 基因组与转录组,深入挖掘基因表达信息

    技术介绍

    一个物种基因组的成千上万个基因各司其职,在不同组织、时期、环境下表达,从而能够翻译出对应不同生长需求或不同环境条件的蛋白,达到生长发育或应急响应等目的。基因的表达量常被用来定量评估基因的转录水平。【时空特异性、组织特异性

    获得高质量的基因组,将使多倍体高重复等复杂物种的转录分析准确性更高,研究结果更具可靠性。基因组结合转录组分析,使得基因功能研究不再仅仅依靠原来的RNA-seq水平的研究,可以从基因序列结合变异信息和基因表达共同研究生物学问题,使问题研究更深入。

    技术路线

    适用范围

    • 特异性状 根源基因挖掘
    • 生长发育重要调控机理
    • 差异基因及调控网络
    • 全基因组动态表达图谱
    • 多倍体优势亚基因组探寻等

    高分案例

    植物案例
    英文名:A mini foxtail millet with an Arabidopsis-like life cycle as a C4 model system[2]
    中文名:一种类拟南芥生命周期可作为C4模型研究的小型谷子
    期刊:Nature Plants(IF:13.256)
    合作单位:山西农业大学

    主要研究内容:
    作者利用 EMS 诱变技术筛选到一个超早熟突变体“xiaomi ”。解决了谷子作为 C4禾谷类模式植物无法在室内大规模培养的难题。在此基础上,高质量参考基因组(组装出 429.94 Mb,其中 399.4 Mb 通过 Hi-C 锚定在 9 条染色体上(挂载率~93%)。BUSCO 评估结果为 97.78%)。“小米”品种间变异分析比较(SNP、InDel、PAV、特有基因)结合健全的生育期基因表达图谱和谷子多组学数据库(http://sky.sxau.edu.cn/MDSi.htm),快捷、高效稳定的农杆菌转化体系极大地方便了“小米”功能基因组学研究。

    动物案例
    英文名:Genomic and transcriptomic insights into molecular basis of sexually dimorphic nuptial spines in Leptobrachium leishanense[3]
    中文名:雷山髭蟾角质刺形成分子基础的基因组及转录组学研究
    期刊:Nature Communications(IF:12.121)
    合作单位:华中师范大学

    主要研究内容:
    作者以雷山髭蟾为研究对象,通过PacBio+Hi-C技术组装出 3.54 Gb 基因组,contig N50为1.93 Mb,scaffold N50=395 Mb,通过比较基因组学分析及雌雄个体不同发育时期的有参转录组分析鉴定了一系列与角质刺性二态发育相关的生物学通路和关键基因。研究成果首次较全面地解析了两栖动物性二态形成相关的重要生物学通路以及关键基因,弥补了相关研究的不足。该成果不仅为两栖动物基因组数据库提供了高质量的参考基因组,而且对于深入理解脊椎动物性二态形成及调控的分子机制具有重要意义。

    方案二 基因组联合代谢组与转录组锁定关键通路

    技术介绍
    代谢组是指生物体内源性代谢物质的动态整体,而代谢组研究能更有效地揭示生物学过程及其生化、分子机理。差异积累的代谢物信息将辅助众多基因进行”共表达”分析,揭示基因功能,并将基因与表型关联起来。转录组和代谢组可以从大量转录组信息中发掘差异基因,快速判断核心调控网络和关键候选基因,阐述生物学机理。基因组结合转录组及代谢组,将系统的锁定关键通路中的基因和代谢物

    技术路线

    适用范围

    • 性状遗传改良
    • 确定代谢关键途径
    • 蔬果花卉色泽营养
    • 合成代谢通路网络搭建
    • 鉴定控制关键途径的结构
    • 生长发育、抗逆及其生化、分子机理

    高分案例

    植物案例一
    英文名:Genomes of the banyan tree and pollinator wasp provide insights into fig-wasp coevolution[4]
    中文名:榕树和榕小蜂的基因组为榕-蜂共生体系协同进化提供线索
    期刊:Cell(IF:38.637)
    合作单位:福建农林大学基因组研究中心

    主要研究内容:
    作者基于三代PacBio、Hi-C和遗传图谱等技术成功构建了2种榕树和1种传粉榕小蜂的高质量基因组(细叶榕426Mb,contigN50=908 Kb;对叶榕360 Mb,contigN50= 492 kb;榕小蜂387 Mb,contig N50=3.1 Mb)。比较基因组学研究发现两种榕树基因组存在大量的结构变异,为其适应性演化提供了遗传基础。并对榕树气生根、性别决定基因、榕树进化、等进行研究。结合代谢组将榕果释放挥发物质以及榕小蜂对这些物质的电生理测试阐明榕蜂共生体系专性协同进化。本次研究首次在基因组水平上揭示了榕-蜂共生体系在形态和生理方面的协同演化对双方类群的协同多样化的重要影响。

    植物案例二
    英文名:Musa balbisiana genome reveals subgenome evolution and functional divergence[5]
    中文名:香蕉基因组揭示了亚基因组进化和功能分化
    期刊:Nature Plants(IF:13.256)
    合作单位:中国热带农业科学院

    主要研究内容:
    作者利用二代+三代+HI-C的测序技术,成功构建了高质量的香蕉B基因组的图谱(492.77Mb,contig N50=1.83Mb),为进一步改良香蕉的农艺性状奠定了基础。香蕉A、B基因组的比较分析揭示了A、B基因组的分化特点;重测序数据分析,揭示了香蕉的遗传多样性及亚基因组功能分化;果实乙烯释放量等代谢物的测定及不同果实成熟阶段的香蕉的转录组分析结合香蕉的基因扩增和表达模式的研究发现了果实成熟的演变和调控特征。基于这些研究结果,将有助于香蕉新品种的育种策略。

    方案三 基因组与群体进化,解析物种发展历程

    技术介绍
    动植物特定群体的个体基因组之间往往会存在大量变异,如单核苷酸变异(SNP)、插入缺失变异(InDel)、结构变异(SV)等。自然群体区别于驯化栽培群体最大的特征是其丰富的遗传多样性,这些动植物往往经历了种群的扩张、传播、本地化适应、基因交流等长期驯化过程。利用基因组水平遗传变异研究,可以更加准确和全面地解析动植物群体的系统发生关系及其结构、群体进化历史、遗传渐渗、驯化起源与人工选择位点情况。该研究方案是目前广受高分基因组学相关期刊“青睐”之一的研究策略。

    技术路线

    适用范围

    • 不同群体分化历程探究
    • 建立亚群间精确变异数据库
    • 地域种、品系间基因渗透历程
    • 动植物起源地、驯化与环境适应性研究
    • 挖掘与人工/自然选择性状相关基因位点

    高分案例

    植物案例
    英文名:The bracteatus pineapple genome and domestication of clonally propagated crops[6]
    中文名:红苞凤梨参考基因组及作物的无性繁殖驯化
    期刊:Nature Genetics(IF:27.603)
    合作单位:福建农林大学

    主要研究内容:
    作者对红苞凤梨(*Ananas comosus *var. bracteatus)的基因组进行了分析(60X Illumina+50X PacBio+Hi-C,组装513Mb基因组,contig N50=427 Kb)并将之与80多个菠萝栽培品种和野生祖先进行比较(重测序~17.5X Illumina), 追溯了菠萝驯化史, 发现其既经历了有性生殖过程,也有“一步到位”的无性繁殖过程, 还找到了基因组中与菠萝特异农艺性状相关的人工选择区段, 为菠萝的遗传育种奠定了科学基础。

    动物案例
    英文名:Genomic Consequences of Population Decline in Critically Endangered Pangolins and Their Demographic Histories[7]
    中文名:濒危物种穿山甲基因组学研究及种群研究
    期刊:National Science Review(IF:16.693)
    合作单位:云南大学

    主要研究内容:
    作者基于二代测序技术结合10X Genomics构建了高质量的穿山甲参考基因组(基因组大小MJ 2.45G;MP 2.40 G,scaffold N50分别为13.85和7.77Mb)。还通过73个马来穿山甲和23个中华穿山甲重测序分析(12.12 -21.16X Illumina)进行变异检测和群体结构分析、穿山甲遗传多样性分析及种群历史动态分析等。提供了有关穿山甲种群数量长期波动的驱动因素和最近由于人类活动导致的种群数量减少的基因组影响的有价值的信息,这对穿山甲保护管理和全球行动规划至关重要。

    方案四 基因组结合GWAS与进化,探索重组遗传效应

    技术介绍
    全基因组关联分析(genome-wide association study,GWAS)是指全基因组水平分析各位点与复杂性状遗传变异的关联强弱。GWAS无需构建群体,从自然界中采样即可基于基因组数据,充分利用群体进化过程中数千世代积累的重组事件,分析分子标记对表现型的遗传效应。高质量的基因组联合GWAS分析将使得复杂性状的遗传基础得以剖析,也是目前广受高分基因组学相关期刊“青睐”之一的研究策略。

    技术路线

    适用范围

    • 研究物种染色体倍性一致
    • 未分化出明显的不同群体结构
    • 研究群体样本量较大(推荐≥200个)
    • 作物、果蔬、草本、林木花卉及水产家禽等物种性状相关位点关联

    高分案例

    植物案例
    英文名:Resequencing of 243 diploid cotton accessions based on an updated A genome identifies the genetic basis of key agronomic traits[8]
    中文名:以更新的亚洲棉 A 基因组为基础的 243 份二倍体棉花的重要农艺性状的研究
    期刊:Nature Genetics(IF:27.603)
    合作单位:中国农业科学院棉花研究所

    主要研究内容:
    作者通过PacBio+Hi-C技术进行基因组denovo,提升了亚洲棉的基因组组装水平(组装1.71 Gb,Contig N50=1.1 Mb)。然后通过群体进化分析发现,亚洲棉和草棉与雷蒙德氏棉同时进行了分化,而亚洲棉起源于中国南部,随后被引入长江和黄河地区。大多数与驯化相关的性状都经历了地理隔离。通过亚洲棉的GWAS分析,鉴定了11个重要农艺性状的98个显著关联位点,并对脂肪酸合成、棉花枯萎病抗性、棉绒性状的位点进行详细分析。本研究对理解棉花A亚基因组的进化具有重要的意义。

    动物案例
    英文名:The evolutionary origin and domestication history of goldfish (Carassius auratus)[9]
    中文名:金鱼的进化起源和驯化史
    期刊:PNAS(IF:9.412)
    合作单位:福建农林大学&福建师范大学

    主要研究内容:
    作者通过PacBio+Hi-C组装获得了高质量的金鱼基因组 (2n=100;组装1.73 Gb,Scaffold N50= 606 Kb)的同时,通过比较基因组学研究解析了古代杂交事件产生了两个亚基因组;进一步通过185条代表性金鱼变种和16条野生鲫鱼的重测序分析,揭示了金鱼的起源,并鉴定了与驯化相关的受选择基因区域。研究中全面收集了金鱼品种,获得了与众多解剖特征相关遗传变异信息,其中包括区分传统金鱼进化的特征。除此之外,鉴定了酪氨酸蛋白激酶受体作为透明突变体的候选基因。为金鱼的基因组和多样性数据提供了丰富的资源,使得金鱼成为功能基因组学和驯化研究具前景的模型。

    精彩不停歇由于文章篇幅有限,今天小编就叨叨到这里啦~其实动植物基因组学具有无限研究潜力,其分析意义已不仅在于文章的影响因子高低,更多的是如何完整的阐述一种生物现象,为生产育种以及物种保护提供重要的基础理论以及获取基因标记信息。

    参考文献:

    [1] 樊龙江.植物基因组学[M].2020

    [2] Zhirong Y, Haoshan Z, Xukai L et al.A mini foxtail millet with an Arabidopsis-like life cycle as a C4 model system . Nature Plants. 2020.

    [3] Jun L, Haiyan Y, Wenxia W et al. Genomic and transcriptomic insights into molecular basis of sexually dimorphic nuptial spines in Leptobrachium leishanense. Nature Communications .2019.

    [4] Zhang X,Wang G,Zhang S et al., Genomes of the Banyan Tree and Pollinator Wasp Provide Insights into Fig-Wasp Coevolution.Nature Genetics. 2020

    [5] Wang, Z., Miao, H. et al. Musa balbisiana genome reveals subgenome evolution and functional divergence[J]. Nature Plants, 2019.

    [6] Chen L Y , Vanburen R , Paris M ,* et al*. The bracteatus pineapple genome and domestication of clonally propagated crops. Nature Genetics, 2019.

    [7] ing-Yang H , Zi-Qian H , Laurent F , et al. Genomic consequences of population decline in critically endangered pangolins and their demographic histories. National Science Review.2020

    [8] X Du, G Huang, S He, et al. Resequencing of 243 diploid cotton accessions based on an updated A genome identifies the genetic basis of key agronomic traits. Nature Genetics. 2018

    [9] Chen D, Zhang Q et al., The evolutionary origin and domestication history of goldfish (Carassius auratus).PNAS.2020

    相关文章

      网友评论

          本文标题:基因组学深入挖掘·研究方案(上篇)

          本文链接:https://www.haomeiwen.com/subject/irnvcdtx.html