美文网首页
Nat Biotechnol :多团队发布人类基因组分型组装新方

Nat Biotechnol :多团队发布人类基因组分型组装新方

作者: iBioinformatics | 来源:发表于2023-04-11 09:10 被阅读0次

https://mp.weixin.qq.com/s/Sn0Rju-oalhd-pnI4K2MKg

导语

生信界大牛李恒、Evan E. Eichler及分子生物界大牛George M. Church等人在Nat Biotechnol 联合发表两篇文章,开发了新的基因组组装方法,用来分型和组装染色体水平的人的基因组。

第一篇来自李恒和Church团队
单倍型解析或分型的基因组组装可提供基因组及其复杂遗传变异的完整图谱。但是,当前用于分型组装的算法要么无法生成染色体尺度的分型,要么需要谱系信息,这限制了它们的应用。

本研究提出了一种称为二倍体组装(DipAsm)的方法,该方法使用HiFi数据和Hi-C数据,可以在1天之内生成染色体规模的分相组装。DipAsm应用于四个公共人类基因组(PGP1,HG002,NA12878和HG00733),产生了单倍型解析的组装,contig N50高达25 Mb,大约90.5%的杂合位点可以分型成功,具有98-99%的准确性,在连续性和定相完整性方面均优于其他方法。

研究者证明了染色体规模的分型组装对于发现结构变异(SV)的重要性,包括数千个新的转座子插入,以及高度多态性和医学上重要的区域,例如人白细胞抗原(HLA)和杀伤细胞免疫球蛋白样受体(KIR)区域。 DipAsm将促进高质量的精准医学以及个体单倍型变异和种群多样性的研究。

Figure 1 DipAsm算法的流程

(1)使用Peregrine将HiFi组装成不分相位的 contig;
(2)使用HiRise / 3D-DNA(3D从头组装)将contig与具有Hi-C数据的scaffold进行排序;
(3)将 HiFi 数据mapping到scaffold上,并使用DeepVariant call杂合SNP;
(4)使用 WhatsHap 和 HapCUT2 处理 HiFi 和 Hi-C 数据的杂合SNP;
(5)使用WhatsHap根据相位分区reads;
(6)使用Peregrine将分区的reds组装为分型的contig。

第二篇来自Evan E.Eichler等团队
Strand-seq是一种利用短reads,单细胞测序方法,可保留每个单个细胞中单个同源物的结构连续性。这是通过使用胸苷类似物选择性标记和去除一条DNA链(新生链,在DNA复制过程中合成)来实现的,该DNA链仅生成DNA模板链的定向测序文库。

Strand-seq具有三个重要功能:
1)它可以按染色体对reads或contig进行排序;
2)它可以定序和定向contig;
3)它提供了一个染色体范围内的相位信号,而与物理距离无关。这些功能使Strand-seq成为理想的方法,可与长reads测序数据结合使用,以物理方式进行分型组装二倍体基因组。

本项工作展示了如何通过利用Strand-seq的额外能力来将contig分配给染色体以对其进行分型以及如何将这种连接技术与长读测序(连续长读(CLR),高保真( HiFi)或ONT)。

本研究为二倍体基因组组装提供了一个重要的参考方法,并演示了〜6-Gbp基因组的亲本单倍型的精确组装。

Figure 2 Strand-seq流程文献来源
  1. Garg, S., Fungtammasan, A.,Carroll, A. et al. Chromosome-scale, haplotype-resolved assembly of humangenomes. Nat Biotechnol (2020).https://doi.org/10.1038/s41587-020-0711-0
  2. Porubsky, D., Ebert, P.,Audano, P.A. et al. Fully phased human genome assembly withoutparental data using single-cell strand sequencing and long reads. NatBiotechnol (2020).https://doi.org/10.1038/s41587-020-0719-5

相关文章

  • 生信分析 Nature| 强大的基因组组装工具- Shasta

    Shasta 生信工具箱: 9天完成11个人类基因组基于三代测序的从头组装 杂志:Nat Biotechnol.(...

  • Nat Biotechnol(IF 54.908)| 打开新思路

    蛋白磷酸化修饰具有快速、高效和动态变化的特点,其能够将环境变化和细胞信息关联起来,从而调控生物学过程。然而,一个刺...

  • NAT穿越原理

    NAT穿越分为4种类型:完全锥型、IP 限制锥型、端口限制锥型和对称型。 完全锥型 当 host 主机通过 NAT...

  • SOAPdonova

    SOAPdenovo是一个新颖的适用于组装短reads的方法,能组装出类似人类基因组大小的de novo草图。 1...

  • SOAPdenowo

    SOAPdenovo是一个新颖的适用于组装短reads的方法,能组装出类似人类基因组大小的de novo草图。该软...

  • 目前主要的 NAT 类型

    I. Full-cone NAT, also known as one-to-one NAT(无限制型NAT) 一...

  • 最完整的人参考基因组

    最近看了一篇人基因组组装的文章,和大家分享一下。 国际人类基因组测序协会在2001年发表了人类基因组草图,今天这篇...

  • Dragon star Day 2 Pt.2 关于基因组组装、

    Dragon star Day 2 Pt.2 关于基因组组装、人类基因组计划、七桥问题、图论 Dragonstar...

  • 2022-09-14

    Nat Methods | 高通量绘制T细胞激活序列新方法,快速准确可扩展 原创huacishu图灵基因2022-...

  • hifiasm对HiFi PacBio进行组装

    hifiasm是一个能有效利用PacBio HiFi测序技术,在分型组装图(pahsed assembly gpr...

网友评论

      本文标题:Nat Biotechnol :多团队发布人类基因组分型组装新方

      本文链接:https://www.haomeiwen.com/subject/zuouortx.html