用verkko组装基因组

作者: 卖萌哥 | 来源:发表于2022-10-15 12:18 被阅读0次

    背景介绍

    verkko是一个最新的可以应用于二倍体基因组T2T(telomere-to-telomere)级别的基因组组装的组装软件。

    2022年9月14号李恒在主题为PacBio HiFi数据组装及应用的在线会议上提到过,“目前为止verkko可能是比hifiasm效果更佳的组装二倍体T2T基因组的软件。”

    那它为什么这么厉害呢?

    根据GitHub的介绍,verkko是一个混装PacBio HiFi和ONT数据的基因组组装软件,基于Canu的纠错模块将PacBio HiFi reads纠错后建立multiplex de Bruijn图, 再将ONT序列对齐(align)到图上,逐步解决循环和缠结的区域,最终用Canu的consensus模块得出最终结果。

    所以,如果你想最大限度地发挥verkko的能力,首先你得有PacBio HiFi reads和ONT数据(也许还得是ultra long ONT才行)。

    作为一个非常state-of-art的软件,verkko当然也是支持在大型集群上运行的,不管是SGE, Slurm 还是LSF的作业系统它都是支持滴~ 另外,verkko还支持trio-based phasing ,不过要先用rukkimerqury这两个软件先处理后才能输入给verkko。

    软件安装

    让我们再次感谢conda的方便~

    conda install -c conda-forge -c bioconda -c defaults verkko
    

    软件运行

    由于我只有PacBio HiFi数据,所以就跑个纯hifi的试试水

    verkko -d /path/to/verkko \
    --hifi test1.hifi_reads.fastq.gz \
    test2.hifi_reads.fastq.gz \
    test3.hifi_reads.fastq.gz \
    --no-correction \
    --no-nano \
    --threads 20 \
    --local \
    --local-memory 100 \
    --local-cpus 20
    

    可用资源

    bioRxiv文章:https://www.biorxiv.org/content/10.1101/2022.06.24.497523v1
    GitHub地址:https://github.com/marbl/verkko

    一个无用的小知识

    Verkko is Finnish for net, mesh and graph.

    Verkko在芬兰语中是网、网格和图形的意思。

    私货时间

    1. 可以说verkko是一个所图甚大的基因组组装软件,是标准的state-of-art technology
    2. 有钱真的可以为所欲为。

    相关文章

      网友评论

        本文标题:用verkko组装基因组

        本文链接:https://www.haomeiwen.com/subject/kxwhzrtx.html