美文网首页组学
基因组组装之Verkko,实现T2T级别组装(可与hifiasm

基因组组装之Verkko,实现T2T级别组装(可与hifiasm

作者: PlantResearcher | 来源:发表于2023-06-21 16:16 被阅读0次

Verkko是一个用于实现端粒到端粒(telomere to telomere, T2T)基因组组装的新工具。

  • Rautiainen, M., Nurk, S., Walenz, B.P. et al. Telomere-to-telomere assembly of diploid chromosomes with Verkko. Nat Biotechnol (2023)


    image.png

    如上图所示,流程关键组件包括Canu、MBG、GraphAligner和Rukki,这些组件的整合使得Verkko可以实现自动流程处理输入的三代测序数据,最终获得高连续、高准确率的单倍体分型基因组,高质量三代测序数据的输入可获得T2T组装水平基因组。

#安装,环境要求python=3.7
conda install -c conda-forge -c bioconda -c defaults verkko
#运行,此处以单独hifi测序数据为例
verkko -d /home/verkko_assemb --hifi hifiseq_data.fasta --no-nano --threads 30
##如果为ONT或PacBio HiFi数据则不添加--no-nano

#verkko参数
MANDATORY PARAMETERS:
    -d <output-directory>    Directory to use for verkko intermediate and final results.
                             Will be created if needed.
    --hifi <files ...>       List of files containing PacBio HiFi reads.
    --nano <files ...>       List of files containing Oxford Nanopore reads.

                             Input reads can be any combination of FASTA/FASTQ,
                             uncompressed or gzip/bzip2/xz compressed.  Any
                             number of files can be supplied; *.gz works.

  ALGORITHM PARAMETERS:
    --no-correction          Do not perform Canu correction on the HiFi reads.
    --no-nano                Assemble without ONT data.

    --hap-kmers h1 h2 type  Use rukki to assign paths to haplotypes.  'h1' and 'h2
                            must be Meryl databases of homopolymer-compressed parental
                            kmers.  'type' must be 'trio', 'hic' or 'strandseq'.

    --base-k
    --max-k
    --window
    --threads

    --split-bases
    --split-reads
    --min-ont-length

    --correct-k-mer-size
    --correct-mer-threshold
    --correct-min-read-length
    --correct-min-overlap-length
    --correct-hash-bits

    --seed-min-length
    --seed-max-length
    --align-bandwidth
    --score-fraction
    --min-identity
    --min-score
    --end-clipping
    --incompatible-cutoff
    --max-trace

  COMPUTATIONAL PARAMETERS:
    --python <interpreter>   Path or name of a python interpreter.  Default: 'python'.
    --mbg <path>             Path to MBG.             Default for both is the
    --graphaligner <path>    Path to GraphAligner.    one packaged with verkko.

    --cleanup                Remove intermediate results.
    --no-cleanup             Retain intermediate results (default).

    --local                  Run on the local machine (default).
    --local-memory           Specify the upper limit on memory to use, in GB, default 64
    --local-cpus             Specify the number of CPUs to use, default 'all'

    --sge                    Enable Sun Grid Engine support.
    --slurm                  Enable Slurm support.
    --lsf                    Enable IBM Spectrum LSF support.

    --snakeopts <string>     Append snakemake options in "string" to the
                             snakemake command.  Options MUST be quoted.

    --sto-run                Set resource limits for various stages.
    --mer-run                Format: number-of-cpus memory-in-gb time-in-hours
    --ovb-run                  --cns-run 8 32 2
    --ovs-run
    --red-run
    --mbg-run
    --utg-run
    --spl-run
    --ali-run
    --pop-run
    --utp-run
    --lay-run
    --sub-run
    --par-run
    --cns-run```

相关文章

  • 基因组 组装教程 (T2T)

    导读 本文将介绍T2T基因组,并提供一份基因组组装的资料,其中包含:基因组组装数据和组装策略介绍;染色体水平基因组...

  • hifiasm组装

    参考hifiasm网页代码: https://github.com/chhylp123/hifiasm[https...

  • 用verkko组装基因组

    背景介绍 verkko是一个最新的可以应用于二倍体基因组T2T(telomere-to-telomere)级别的基...

  • 用hifiasm组装基因组

    hifiasm大概是目前为止支持PacBio HiFi数据组装的所有软件中表现最优异的软件了。它不但能输出prim...

  • Bacteria genome denovo assembly

    细菌基因组组装金标准:GAGE-B 组装软件的选择 细菌基因组组装的目标不同于大型生物基因组的组装,大型基因组组装...

  • 基因组组装: 3D-DNA 染色体挂载

    导读 本文将介绍基因组组装过程中,如何利用HiC测序数据,进行染色体级别基因组的组装。该过程主要利用 Juicer...

  • 常用转录组组装软件集合

    转录组组装软件 基因组组装 基因组组装(Genome assembly)是指使用测序方法将待测物种的基因组生成序列...

  • 基因组结构注释

    1. 组装基因组质控 得到组装好的基因组序列之后,首先要使用多种方法评估组装质量。这里用到2款可用于基因组组装质量...

  • 基于参考基因组的基因组组装和注释

    将基因组组装到染色体水平无非就是两种方式: 独立组装(de novo); 基于参考基因组的组装(reference...

  • Hifiasm-meta | 你没看错!基于宏基因组的完成图!!

    哈佛大学医学院Dana-Farber癌症研究所李恒课题组重磅推出三代HiFi宏基因组组装软件——hifiasm-m...

网友评论

    本文标题:基因组组装之Verkko,实现T2T级别组装(可与hifiasm

    本文链接:https://www.haomeiwen.com/subject/qitpydtx.html