美文网首页生信专题组装
SPAdes使用方法(基因组拼接)

SPAdes使用方法(基因组拼接)

作者: 路人里的路人 | 来源:发表于2022-09-06 22:28 被阅读0次

    第一步安装软件

    conda install SPAdes
    #通过miniconda3安装SPAdes,可随时调用,无需再添加环境变量。
    

    第二步转到工作目录

    cd /home/monkeyflower/bioworkplace
    

    第三步,拼装序列

    spades.py --pe1-1 L4-3_1.clean.fq.gz --pe1-2 L4-3_2.clean.fq.gz -t 200 -k 21,33,55,77 -m 600 --careful --phred-offset 33 -o testfile
    #--pe1-1、--pe1-2:需要拼接的前后两个序列
    #-t:线程数
    #-k:kmer选择的值,默认的值为21,33,55,77,数字必须是小于128的奇数
    #-m:内存,最大允许使用内存(GB)
    #--careful:read纠错,减少错误和插入序列
    #--phred-offset:碱基质量体系,在数据纠错中会用到,illumina数据一般采用33
    #-o:输出文件目录
    

    第四步,导出输出文件

    #文件scaffolds.fasta和contigs.fasta便是需要的结果文件
    #corrected/:包含用BayesHammer纠错reads产生*.fastq.gz文件。
    #scaffolds.fasta:包含产生的scaffolds
    #contigs.fasta:包含产生的contigs
    #assembly_graph.gfa:包含SPAdes组装图和scaffolds的路径。
    #assembly_graph.fastg:包含SPAdes组装图。(FASTG格式)
    #contigs.paths:组装图中包含与contigs.fasta对应的路径。
    #scaffolds.paths:组装图中包含与scaffolds.fasta对应的路径
    

    相关文章

      网友评论

        本文标题:SPAdes使用方法(基因组拼接)

        本文链接:https://www.haomeiwen.com/subject/esewnrtx.html