美文网首页
基因组与转录组,深入挖掘基因表达信息--01

基因组与转录组,深入挖掘基因表达信息--01

作者: 百迈客生物 | 来源:发表于2022-09-28 15:59 被阅读0次

技术介绍

一个物种基因组的成千上万个基因各司其职,在不同组织、时期、环境下表达,从而能够翻译出对应不同生长需求或不同环境条件的蛋白,达到生长发育或应急响应等目的。基因的表达量常被用来定量评估基因的转录水平。

获得高质量的基因组,将使多倍体高重复等复杂物种的转录分析准确性更高,研究结果更具可靠性。基因组结合转录组分析,使得基因功能研究不再仅仅依靠原来的RNA-seq水平的研究,可以从基因序列结合变异信息和基因表达共同研究生物学问题,使问题研究更深入。

技术路线


适应范围



案例一

研究背景

黄瓜(Cucumis sativus L.) (2n=2x=14)是世界上重要的蔬菜作物,本研究将栽培黄瓜(Cucumis sativus L., CC,2n=14)与野生酸黄瓜(C. Rs/rix Chakr., HH, 2n=24)进行种间杂交,通过胚胎拯救和染色体加倍,首创了甜瓜属人工异源四倍体新物种"金瓜"并命名为Cucumis hytivus Chen and Kirkbr.o金瓜具有明显的生长力旺盛、营养价值高等优势,同时还具有很强的环境适应性。对具有明确遗传背景的人工异源四倍体C.×hytivus的研究,可以解析多倍体化进程中不同过程的潜在机制,从而揭示异源多倍体在自然界和农业生产中广泛存在的深层含义。

方法流程

研究结果

异源四倍体C.×hytivus(S14)的组装与注释

    组装获得530.8 Mb基因组倍(≈67%流式评估大小;≈77% survey评估大小;比对发现未装出的为重复序列),contig N50=6.5 Mb,并将97.23%序列挂载至19条假染色体上。与已测序的栽培黄瓜基因组一样,金瓜中大部分的TE为长末端重复序列。C.×hytivus(S14)的Che亚基因组(SubC)含有的TEs少于二倍体C.sativus(CC)基因组,而Chh亚基因组(SubH)保持了几乎相同的不同类型TEs的含量和比例。共预测了45687个基因,平均基因长3846bp,每个基因有5.26个外显子。BUSC。评估结果为90.90%, CEGMA评估结果为97.82%。在CC和HH二倍体基因组中鉴定的18882个同源基因家族中,在C. x0Sms(S14)异源四倍体中也鉴定T18428个(97.60%)(图1)。

亚基因组优势分析

    将C.×hytivus(S14)基因组分为Chc(203.36 Mb)和Chh(287.37 Mb)两个亚基因组,与CC相比,在Chh亚基因组中检测到的SVs更多,并且基因丢失更多。在C. x^rivw5(S14)基因组中分别丢失11个CC和146个HH基因,同时更多的HH序列被CC序列替换,CC显性基因的数量明显多于HH显性基因(图1)。这些结果表明Che亚基因组可能比Chh 亚基因组更占优势。CC和Che亚基因组的TE含量低于HH和Chh亚基因组,支持了由祖先细胞基因组中TE的差异密度驱动异源多倍体中亚基因组偏向分化的假说。

种间杂交、基因组加倍和二倍体化

    异源多倍体化过程中种间杂交、基因组加倍和二倍体化三个重要阶段对基因组的作用各不相同。作者分别在种间杂种F1、金瓜初世代SO和其他早期世代(S4~S13)中对S14世代中预测的157个确认缺失的基因进行鉴定。F1中有102个基因缺失,表明种间杂交事件发生后,核基因组序列立即被消除。通过与HH相比,检测各世代的叶绿体基因组中SNPs和InDels(图2 )。检测到大多数SNPs和InDeis在Fl中,推测多倍体中被广泛发现的亚基因组优势现象在种间杂交过程中就已经基本确定了,并在后续的进化过程逐渐累积。而在二倍体化过程中,基因组的变化也主要发生在最初的几个世代(S0~S3),之后的世代中仅观察到零星的核序列丢失(基因丟失),并且叶绿体基因组中没有发现新的SNPs或InDelso。

多倍体化拓宽物种遗传基础,增强物种适应能力

    基因序列与表达量分析发现金瓜中保留了来自双亲的大多数重复的NBS-LRR编码基因,使其具有更强的抗病能力,比亲本物种具有更强的生存力。高温和对照条件下,C.×hytivus与其两个二倍体亲本叶片的生长、生理反应和转录组表达水平研究表明,主要参与光合生物的固碳、碳代谢、乙醛酸和二務酸代谢相关的基因在C.×hytivus中显著表达,而亲本中则没有。证实了在热胁迫下,C.×hytivus叶绿素积累和光合作用的增强,进一步说明了金瓜具有耐热性。

总结

    本研究完成了首个人工合成多倍体“金瓜”的染色体水平基因组组装,并对其亚基因组进行了精确 区分。揭示并初步阐明了在异源多倍化物种形成三个阶段中,种间杂交的作用最为显著,以及亚基因组 优势形成机制。金瓜不仅表现出明显的杂种优势,同时还具有很强的环境适应性,是利用多倍体化幵发 作物新品种的真实范例。本研究对于加强植物多倍化研究及作物育种利用具有重要意义。

参考文献

案例二

研究背景

    绿色植物可分为两个门,一类是链形生物,包括营淡水生轮藻和所有陆生植物,另一类是绿藻。其中,轮藻植物较为复杂,有单细胞的,也有多细胞的,其中两个主要的谱系Mesostigma和Chlorokybus是最早分化的链形生物。多细胞轮藻与陆生植物关系最近,所以多细胞轮藻包含很多与陆生植物相同的生物特征。目前,所有得到基因组的链形生物均为多细胞轮藻和陆生植物,仍没有单细胞轮藻基因组报道,这不利于研究植物的多细胞化进程。Mesostigma viride是一种细胞表面覆有篮子状鳞屑的无细胞壁的单细胞轮藻,是最早分化的链形植物之一, 这使得Mesostigma viride成为研究多细胞生物的进化和陆生植物起源的理想材料。

方法流程

研究结果

Mesostigma viride基因组组装

    基于162x Illumina数据、113x PacBio数据和113x的光学图谱数据,组装得到Mesostigma viride的基因组,基因组大小442 Mb,scaf- foldsN50为2.6 Mb BUSCO评估基因组完整度为90.1%,预测得到24431蛋白编码基因。

基因组进化

    与选择的18个绿色植物相比,Mesostigma viride基因组中接近—半的基因为该物种特异基因。在进化树上,Mesostigma viride在链形植物的基部分枝,再一次验证了它是最早分化的绿色植物。基因家族的数量与物种形态的复杂性似乎相关。通过比较基因序列相似性,发现Mesostigma viride与早期分化的陆生植物的基因序列相似度较绿藻植物更高

    Mesostigma viride基因组中含有大量片段重复,推测可能发生过全基因组复制事件。重复序列以LTR逆转录转座子为主,而且LTR序列较长,这也是为什么Mesostigma viride基因组相对于其他绿藻来说较大的原因。

从单细胞到多细胞再到陆生植物的进化分析

    比较多个轮藻与绿藻的基因组,发现轮藻中富集了很多与陆生植物相关而在绿藻是没有的的Go term, 如种子萌发正调控、根发育、花序发育、气孔复合体等,再次验证了陆生植物起源于轮藻而非绿藻。Mesostigma viride基因组中大多数的转录因子是绿色植物共有的,但其基因家族个数却是已知链形生物中最少,这可能是由于它有着最简单形态结构。

    Mesostigma viride基因组中含有很多在真核生物中发现的与表观调控相关基因的同源基因,同时发现这些基因的表达水平会随着生长环境的变化而发生动态变化,说明绿色植物响应环境变化的表观调控现象至少在轮藻中就已经存在了。

环境胁迫响应

    不同环境胁迫(高低温、强弱光照、高低pH 等)转录组分析发现高温处理前后,大量基因出现表达差异,这些差异富集在很多生物过程(如氧化还原调节、蛋白质伴随和修复、DNA损伤检测和修复、麦芽糖、硫和辅酶代谢),Mesostigma viride表现出的细胞胁迫响应与所有生物体是一致的。光照胁迫下,鉴定得到一些差异表达基因,这些基因涉及到光合作用、光系统II组装、叶绿素生物合成过程和类囊体膜组织等过程,以上结果说明陆地植物的通用光合作用体系已经在初级的链形植物上建立起来了。

总结

    本研究借助二代、三代PacBio和光学图谱的方法,组装获得了最古老的单细胞轮Mesostigma viride高质量的基因组。通过比较基因组以及转录组分析,发现单细胞轮藻已经拥有了大量和陆生植物性状相关的遗传信息,同时陆生植物从单细胞轮藻中继承了很多“遗传工具”,该研究揭示了植物从单细胞到 多细胞的进化历程与陆生植物的起源。

参考文献

案例三

研究背景

    目前常用的模式植物拟南芥和水稻都是C_{3} 植物,谷子、玉米、高粱这种高产作物属于C_{4} 植物,C_{3} 模式植物作为C_{4} 禾谷类作物的模式植物时有很大的局限性。谷子是我国几千年来的主栽作物和中华民族的哺育作物,具有抗旱、耐瘠薄和高光效等突出优势,恰恰弥补了拟南芥和水稻作为模式植物的不足,是极具发展潜力的禾谷类模式植物。但谷子生育期较长、株高较高、遗传转化困难,极大地限制了其作为模式植物在功能基因组学研究中的应用。

方法流程

研究结果

“小米”的创造与表型表征

    利用EMS诱变技术对山西省名优谷子晋谷21进行了诱变,从中筛选到一个超早熟突变体“小米”。为了找出导致“小米”早熟的突变,研究者将其与抽穗期为75DAS的G1杂交。所有9株F1植株均表现出类似G1的晚抽穗表型。结合RNA-seq等研究表明“小米”早熟的表型是由于光周期通路的中断引起的。

“小米”基因组组装

    组装出429.94 Mb “xiaomi ”基因组,其中399.4 Mb通过Hi-C锚定在9条染色体上(挂载率〜93%) 。BUSCO评估结果为97.78%O共预测到34436个蛋白质编码基因,所有的基因组和转录组数据可在数据库

“小米”基因组比较分析

    “小米”与豫谷1号、张谷和TT8的3个基因组序列相比;“小米”基因组 在基因组覆盖率、contig N50、gap数方面表现很大的提升,且与豫谷1 号相比,共检测出1577935个SNPs和259731个InDei。32112个基因在“xiaomi”与豫谷1号中共有,有1030个基因,在豫谷1号和张谷中均未发现,为“xiaomi"特有基因。

图2小米”与豫谷1号基因组比较圈图

“小米”早熟基因功能定位

    为定位早花相关基因,作者利用“小米”与晚花表型G1杂交,构建F2群体,证明早花表型由隐性单基因控制后,利用106株F2个体,将基因定位到9号染色体上的212kb区域,后期结合亲本重测序数据,在定位区间内变异检测,发现“小米”基因Si9g09200(编码一种假定的PHYC蛋白)的突变,导致“小米” 早花性状的产生。

图3早花性状基因定位

“小米”动态基因表达图谱的构建

    作者检测了“小米”不同发育阶段的11种不同组织的转录组,总对1054.51 M reads(每个样本约30M reads)生物信息分析。从顶二叶到授粉期圆锥花序检测到的基因表达比例为74.26%〜82.95%, 11个“小米”组织共表达22202个基因,这些基因中,85个(0.25%)在所有被测组织中都有组成性表达,包括一个转录起始因子(Si3G07600)和两个泛素结合酶编码基因(SilG37980Si2G05250)。此外,还鉴定了1218个器官/组织特异基因和1226个器官/组织优先表达基因。后期,作者对各种因素进行 了测试,以开发出适合“小米”的农杆菌介导的 转化方案。

总结

本次研究利用EMS诱变技术对山西省名优谷子晋谷21进行了诱变,从中筛选到一个超早熟突变体“xiaomi”。该突变体生育期仅仅两个月左右,株高仅30 cm左右,从而解决了谷子作为Q禾谷类模式植物无法在室内大规模培养的难题。在此基础上,高质量参考基因组,健全的生育期基因表达图谱和谷子多组学数据库,快捷、高效、稳定的农杆菌转化体系极大的方便了 “小米”功能基因组学研究。

参考文献

相关文章

网友评论

      本文标题:基因组与转录组,深入挖掘基因表达信息--01

      本文链接:https://www.haomeiwen.com/subject/gdhkartx.html