美文网首页生信入门
用nextDenovo组装基因组

用nextDenovo组装基因组

作者: 卖萌哥 | 来源:发表于2022-10-12 10:49 被阅读0次

背景介绍

NextDenovo是武汉未来组(现在可能得叫希望组了)开发的用于三代基因组组装的软件。
想当年读硕士的时候我还因为项目合作的事儿在未来组呆了好几个月来着。

可用资源

GitHub地址:https://github.com/Nextomics/NextDenovo
官方文档: https://nextdenovo.readthedocs.io/en/latest/
洲更学长的笔记:ttps://xuzhougeng.top/archives/Assembly-nanopore-with-NextDenovo

软件安装

安装起来比较轻松愉快,因为软件本体不需要安装,有编译好的二进制文件可以直接下载使用。唯一需要安装的就是一个python的依赖Paralleltask

# 下载软件本体
wget https://github.com/Nextomics/NextDenovo/releases/download/v2.5.0/NextDenovo.tgz
# 安装依赖
python -m pip install Paralleltask
# 解压软件
tar -zxvf NextDenovo.tgz

软件测试

压缩包解压开之后可以找到里面有个test_data文件夹和它下面的示例程序test_data/run.cfg,可以直接运行测试一下软件能不能在你的服务器上跑通。当然这一步是非必须的哈。

cd NextDenovo
nextDenovo test_data/run.cfg

运行自己的项目

生成输入文件

把自己的组装数据的绝对路径存入文件并命名成input.fofn

ls /path/to/01RawData/PacBio/*hifi_reads.fastq.gz > input.fofn

编写config文件

拷贝一份测试数据的cfg文件过来

cp ../NextDenovo/doc/run.cfg .

按照自己的项目的实际情况去修改参数。我的test.run.cfg文件如下:

[General]
job_type = local # local, slurm, sge, pbs, lsf
job_prefix = test_nextDenovo
task = all # all, correct, assemble
rewrite = yes # yes/no
deltmp = yes 
parallel_jobs = 24 # number of tasks used to run in parallel
input_type = raw # raw, corrected
read_type = hifi # clr, ont, hifi
input_fofn = input.fofn
workdir = 01_rundir

[correct_option]
read_cutoff = 1k
genome_size = x.xg # estimated genome size
sort_options = -m 20g -t 15
minimap2_options_raw = -t 8
pa_correction = 3 # number of corrected tasks used to run in parallel, each corrected task requires ~TOTAL_INPUT_BASES/4 bytes of memory usage.
correction_options = -p 15

[assemble_option]
minimap2_options_cns = -t 8 
nextgraph_options = -a 1

更多的参数说明可以访问下面这个官方教程地址:

https://nextdenovo.readthedocs.io/en/latest/OPTION.html

接下来去run就可以了

nohup nextDenovo test.run.cfg &

私货时间

  1. 在我目前用PacBio HiFi数据组装基因组的项目中,NextDenovo的效果仅次于hifiasm。
  2. GitHub上目前NextDenovo团队是把HiFi给划掉了,不知道是不推荐使用NextDenovo用于组装HiFi数据还是啥别的意思。
  3. NextDenovo现在文章还未发布,如果使用了请引用GitHub地址:
    https://github.com/Nextomics/NextDenovo

相关文章

  • 用nextDenovo组装基因组

    背景介绍 NextDenovo是武汉未来组(现在可能得叫希望组了)开发的用于三代基因组组装的软件。想当年读硕士的时...

  • NextDenovo 组装基因组

    NextDenovo 是有武汉未来组团队开发出来用于组装ONT,Pacbio, HIFI (默认参数可对60-10...

  • racon+pilon进行三代+二代数据纠错

    现在基因组组装的流程一般是用nextdenovo直接组装三代数据,但是三代数据组装出来一般都会有一些问题,所以要对...

  • Bacteria genome denovo assembly

    细菌基因组组装金标准:GAGE-B 组装软件的选择 细菌基因组组装的目标不同于大型生物基因组的组装,大型基因组组装...

  • HiFi Reads基因组组装:快、准、狠

    最近,关于用HiFi Reads组装的消息不断刷新了我们对基因组组装的认知:高重复高杂合的加州红杉超大基因组组装在...

  • 常用转录组组装软件集合

    转录组组装软件 基因组组装 基因组组装(Genome assembly)是指使用测序方法将待测物种的基因组生成序列...

  • 基因组结构注释

    1. 组装基因组质控 得到组装好的基因组序列之后,首先要使用多种方法评估组装质量。这里用到2款可用于基因组组装质量...

  • 使用NextDenovo组装Nanopore数据

    NextDenovo是武汉未来组胡江博士团队开发的一个三代组装工具,能够用于PacBio和Nanopore数据的组...

  • 基因组 组装教程 (T2T)

    导读 本文将介绍T2T基因组,并提供一份基因组组装的资料,其中包含:基因组组装数据和组装策略介绍;染色体水平基因组...

  • 「干活」基因组组装 学习笔记 - 入门知识点和Genome Su

    基因组组装学习笔记(一) 基因组组装的前期工作:需要掌握什么知识点? 1)基因组大小 / genome size:...

网友评论

    本文标题:用nextDenovo组装基因组

    本文链接:https://www.haomeiwen.com/subject/nrytzrtx.html