第一步安装软件
conda install SPAdes
#通过miniconda3安装SPAdes,可随时调用,无需再添加环境变量。
第二步转到工作目录
cd /home/monkeyflower/bioworkplace
第三步,拼装序列
spades.py --pe1-1 L4-3_1.clean.fq.gz --pe1-2 L4-3_2.clean.fq.gz -t 200 -k 21,33,55,77 -m 600 --careful --phred-offset 33 -o testfile
#--pe1-1、--pe1-2:需要拼接的前后两个序列
#-t:线程数
#-k:kmer选择的值,默认的值为21,33,55,77,数字必须是小于128的奇数
#-m:内存,最大允许使用内存(GB)
#--careful:read纠错,减少错误和插入序列
#--phred-offset:碱基质量体系,在数据纠错中会用到,illumina数据一般采用33
#-o:输出文件目录
第四步,导出输出文件
#文件scaffolds.fasta和contigs.fasta便是需要的结果文件
#corrected/:包含用BayesHammer纠错reads产生*.fastq.gz文件。
#scaffolds.fasta:包含产生的scaffolds
#contigs.fasta:包含产生的contigs
#assembly_graph.gfa:包含SPAdes组装图和scaffolds的路径。
#assembly_graph.fastg:包含SPAdes组装图。(FASTG格式)
#contigs.paths:组装图中包含与contigs.fasta对应的路径。
#scaffolds.paths:组装图中包含与scaffolds.fasta对应的路径
网友评论