关于单倍型和Phasing

作者: 生物信息与育种 | 来源:发表于2021-01-14 15:23 被阅读0次

    单倍型,即单倍体基因型,概念很好理解。


    image.png

    单倍型分型的过程就称之Phasing,定相或基因分型。

    Phasing的意义,在人类疾病遗传和动植物群体遗传中非常重要。也是imputation的必经过程。

    vcf文件中,./..|.分别表示未定相和已定相。

    Phasing的方法:

    • 家系定相,最准确,一般根据一家三口(Trio样本)推断,直接简单;
    • LD定相,最常用,根据群体LD block和统计模型,计算量大,只对高频突变(如>5%);
    • 物理定相,仅依赖测序数据,通过reads(来自同一单倍体)拼接,高深度测序能实现完全定相。

    定相和填补同步进行,常用软件:

    • shapeit,beagle(人类居多)
    • impute2
    • Tassel(玉米)
    • Falcon-unzip(三代)

    对于PacBio HiFi的二倍体数据,可直接用IPA,hifiasm或HiCanu等组装软件完成定相。

    更详细的解释可参考:
    人类基因组的Phasing原理是什么?

    https://www.dxy.cn/bbs/newweb/pc/post/1788966

    相关文章

      网友评论

        本文标题:关于单倍型和Phasing

        本文链接:https://www.haomeiwen.com/subject/smdvaktx.html