美文网首页微生物
组装细菌基因组

组装细菌基因组

作者: 三三_Z | 来源:发表于2019-12-04 21:17 被阅读0次

    步骤如下:

    1.上Genome Announcements网站(https://mra.asm.org/)找一篇细菌基因组文章;找到文章记载的SRA号

    引用该篇文章的SRA号https://mra.asm.org/content/5/15/e00171-17

    该文章的SRA号SRR5210995

    2.从SRA数据库上用prefetch下载该文件

    prefetch SRR5210995
    

    得到如下结果


    该文件已成功下载

    3.Fastq-dump解压

    fastq-dump --split-files ~/ncbi/public/sra/SRR5210995.sra
    fastq-dump --gzip --split-files ~/ncbi/public/sra/SRR5210995.sra
    

    结果如下


    文件解压成功

    4.对原始数据进行fastqc质量检测

    fastqc SRR5210995_1.fastq.gz
    fastqc SRR5210995_2.fastq.gz
    

    结果如下


    质控完成

    去图形界面找到结果文件,打开


    SRR5210995_1.fastq.gz的结果
    SRR5210995_2.fastq.gz结果

    5.原始数据过滤

    mkdir trim_out
    java -jar ~/Biosofts/Trimmomatic038/Trimmomatic-0.38/trimmomatic-0.38.jar PE -phred33 SRR5210995_1.fastq.gz SRR5210995_2.fastq.gz
    ./trim_out/output_forward_paired.fq.gz ./trirm_out/output_forward_unpaired.fq.gz ./trim_out/output_reverse_paired.fq.gz ./trim_out/output_reverse_unpaired.fq.gz ILLUMINACLIP:/home/eris/Biosofts/Trimmomatic038/Trimmomatic-0.38/adapters/TruSeq2-PE.fa:2:30:10 SLIDINGWINDOW:5:20 LEADING:20 TRAILING:20 MINLEN:75
    

    结果如下


    数据过滤成功

    6.再次查看质量

    此时一定要选paired

    cd /home/eris/trim_out
    fastqc output_forward_paired.fq.gz
    
    提示成功

    再去图形界面查看


    结果

    7.运行SPAdes,组装细菌基因组

    cd ~ 
    spades.py --careful --pe1-1 SRR5210995_1.fastq.gz --pe1-2 SRR5210995_2.fastq.gz -o ./SPAdesout_SRR5210995
    

    一定要确保自己的内存足够,不然会出现error:out of memory
    结果图如下


    成功

    8.Quast评价组装的基因组效果

    quast.py ~/SPAdesout_SRR5210995/contigs.fasta -o ~/SPAdesout_SRR5210995/quast_out
    

    结果如下


    显示成功

    去图形界面下打开html


    结果图

    相关文章

      网友评论

        本文标题:组装细菌基因组

        本文链接:https://www.haomeiwen.com/subject/thqrgctx.html