美文网首页基因组组装组装
Canu | 三代测序数据组装软件②

Canu | 三代测序数据组装软件②

作者: 生信百宝箱 | 来源:发表于2022-07-06 00:03 被阅读0次

Canu软件简介

Canu软件是Celera Assembler基因组组装软件的一个分支,能利用测序错误率较高的三代测序数据(PacBio或Nanopore)进行基因组De novo组装。该软件的命令行运行方法非常简单,运行速度较快且比较稳定,并能得到好的基因组组装结果。

Canu软件的运行分四个步骤:(1)首先,调用MHAP软件对错误率较高的三代测序raw reads进行比对,找序列之间的重叠;(2)然后,通过一致性分析方法对reads进行校正;(3)对reads两端覆盖度较低无法校正的碱基进行截短,对reads内部无法校正的碱基位点进行打断;(4)使用OLC算法进行基因组组装。

Canu官网:

https://github.com/marbl/canu

Canu软件安装:

#利用conda安装canu
conda install -y caun
#编译安装canu
wget \
https://github.com/marbl/canu/archive/refs/heads/canu-master.zip
#解压文件
unzip master.zip
#安装软件
cd canu-master/src
make -j
#将软件添加到环境变量(根据自己的安装路径进行添加)
vim ~/.bashrc
PATH=/opt/biosoft/GENOME/canu-2.0/Linux-amd64/bin/:$PATH
source ~/.bashrc

Canu示例数据下载:

#pacbio示例数据下载
wget \
-O pacbio.sra \
https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR8494912/SRR8494912
#nanopore示例数据下载
wget \
-O nanopore.sra \
https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR8494939/SRR8494939

Canu示例数据处理(sra转fastq):

#pacbio示例数据处理(sra转fastq)
fastq-dump --gzip --split-3 pacbio.sra
#nanopore示例数据处理(sra转fastq)
fastq-dump --gzip --split-3 nanopore.sra

fastq-dump会将sra格式转化成fastq格式,同时--gzip参数会对fastq进行压缩,示例pacbio.sra最终会被转化为pacbio.fastq.gz

Canu常用普通参数:

-s : 输入一个参数配置文件,该文件包含很多其他参数,参数都是以Tag=value形式写入到该配置文件中。
-p : 设置输出文件前缀,此参数是必须的;
-d : 设置输出文件路径;
-pacbio-raw : 设置原始pacbio测序数据路径;
-pacbio-corrected : 设置修正后的pacbio测序数据路径;
-nanopore-raw :设置原始nanopore测序数据路径;
-nanopore-corrected :设置修正后的nanopore测序数据路径;
genomeSize : 设置预估的基因组大小,这用于让Canu估计测序深度;
maxThreads : 设置运行的最大线程数。

Canu使用案例:

canu \
-d pacbio_canu_out \
-p pacbio_canu \
genomeSize=5.4m \
maxThreads=12 \
-pacbio-raw pacbio.fastq.gz

Canu主要结果输出文件:

#最终拼接结果文件,用于下游分析
pacbio_canu.contigs.fasta

相关文章

  • Canu | 三代测序数据组装软件②

    Canu软件简介 Canu软件是Celera Assembler基因组组装软件的一个分支,能利用测序错误率较高的三...

  • wtdbg 组装基因组

    关键词:pacbio; nanopore; assemble wtdbg相较于其他三代四代数据组装软件(Canu,...

  • Canu

    Canu Canu是基于OLC算法,具有长reads的自纠错和组装功能,是应用最为广泛的三代组装软件(速度相对较慢...

  • canu - 三代测序组装工具

    canu - 三代测序组装工具 本文大部分参考或者来自于大神hoptop的简书,在此说明一下。最近由于需要组装三代...

  • wtdbg2 | 三代测序数据组装软件③

    wtdbg2软件介绍 wdbg2能利用三代Pacbio 或 Nanopore 测序数据进行基因组组装。在组装过程中...

  • 使用Canu对三代测序进行基因组组装

    Canu简介 Canu是Celera的继任者,能用于组装PacBio和Nanopore两家公司得到的测序结果。 C...

  • 三代测序组装工具Canu学习笔记

    Canu简介 Canu是Celera的继任者,能用于组装PacBio和Nanopore两家公司得到的测序结果。 C...

  • 三代组装软件Canu简介

    作者:May审稿:童蒙编辑:angelica 对于长读长序列组装,之前已经简单介绍了几款常用软件(详见三代组装软件...

  • 关于canu的使用测试

    由于我有自己的三代subreads需要组装,我先看一下canu组装的效果,再此之前,先用官方提供的测试数据Esch...

  • Flye | 三代测序数据组装软件①

    Flye软件简介 Flye是美国加利福尼亚大学圣迭戈分校开发的针对三代测序数据的基因组de novo组装的生信软件...

网友评论

    本文标题:Canu | 三代测序数据组装软件②

    本文链接:https://www.haomeiwen.com/subject/vwsubrtx.html