美文网首页基因组组装
「基因组」hifiasm重大更新:支持Utralong ONT数

「基因组」hifiasm重大更新:支持Utralong ONT数

作者: 溪溪溪溪溪川 | 来源:发表于2023-03-26 15:04 被阅读0次

    hifiasm下载地址

    截止今天为止,hifiasm官网更到0.19.3版本(五天前更新!!!):https://github.com/chhylp123/hifiasm/releases
    2022.11.18号:Hifiasm-0.16.1 (r375)升级到Hifiasm-0.17.4 (r455) beta,截止今天(2023.3.22)升级到Hifiasm-0.19.3-r572;更新2023.4.21升级到Hifiasm-0.19.5-r578,这半年期间保持高频率更新,主要更新是支持超长ONT数据组装,CCS+Utralong ONT混合组装

    组装效果

    目前测试,小基因组contig版本简单基因组能够直接组装到染色体水平,CtN50比16版本翻了一倍,直接前几条Ct就是染色体,最终HiC数据可能只是验证一下是否是0 gap基因组(还在分析中),也就是说简单基因组的T2T版本可能都不用其他的补gap软件进行补gap了。

    组装建议

    目前测试一个小基因组,超长数据necat纠错和HiC数据组装等不同组合测试,最终测试的HiFi+Utralong_nocorrect+HiC数据组合表现较好,得到的contig数目少,基因组N50,最长的conitg序列更长,还是有较多质体或线粒体序列,建议人工比对去除,得到最终的contig基因组。例如shell:

    #加hic组装
    fa=ccs.fasta
    ont=ont.fa
    /share/nas1/pengzw/software/hifiasm-0.19.3/hifiasm -o hifiasm.asm -t40 --h1 H0001_good_1.fq.gz --h2 H0001_good_2.fq.gz --ul $ont $fa 2> assemble.log
    
    #不加hic组装
    fa=ccs.fasta
    ont=ont.fa
    /share/nas1/pengzw/software/hifiasm-0.19.3/hifiasm -o hifiasm.asm -t40 --ul $ont $fa 2> assemble.log  
    
    NCBI最新的质体或线粒体库:

    https://ftp.ncbi.nlm.nih.gov/refseq/release/mitochondrion/'
    https://ftp.ncbi.nlm.nih.gov/refseq/release/plastid/

    其他

    同样的数据,不同的组装软件差别其实挺大。目前,已发表这么多基因组,有的可能换换组装软件,提升质量不在话下,所以分分钟又一篇文章了~

    相关文章

      网友评论

        本文标题:「基因组」hifiasm重大更新:支持Utralong ONT数

        本文链接:https://www.haomeiwen.com/subject/gawordtx.html