美文网首页基因组测序
组装细菌基因组

组装细菌基因组

作者: 努力再努力_cf77 | 来源:发表于2019-12-06 23:13 被阅读0次

    一、在Genome Announcements网站(https://mra.asm.org/)找到一篇细菌基因组文章

    1.标题如下 image.png

    2.有多个SRA号,只选择其中一个SRR9209170 image.png image.png

    二、从SRA数据库上用prefetch下载该文件

    prefetch SRR9209170
    
    image.png

    三、Fastq-dump解压

     cd ncbi/public/sra
    fastq-dump --gzip --split-files SRR9209170.sra
    
    image.png

    四、Fastqc质控;去接头

    1.fastqc质控

    fastqc SRR9209170_1.fastq.gz
    fastqc SRR9209170_2.fastq.gz
    
    image.png
    下载fastq.html文件,用浏览器查看 image.png image.png

    2.去接头

    mkdir trim_out2
    java -jar ~/04-Biosofts/Trimmomatic-0.38/Trimmomatic-0.38/trimmomatic-0.38.jar PE -phred33 SRR9209170_1.fastq.gz SRR9209170_2.fastq.gz ./trim_out2/output_forward_paired.fq.gz ./trim_out2/output_forward_unpaired.fq.gz ./trim_out2/output_reverse_paired.fq.gz ./trim_out2/output_reverse_unpaired.fq.gz ILLUMINACLIP:/home/shucheng/04-Biosofts/Trimmomatic-0.38/Trimmomatic-0.38/adapters/TruSeq2-PE.fa:2:30:10 SLIDINGWINDOW:5:20 LEADING:20 TRAILING:20 MINLEN:75
    
    结果有四个文件存放在trim_out2里 image.png image.png

    3.对匹配上正向反向的序列再次用fastqc,比较去接头之后的质量变化

    fastqc output_forward_paired.fq.gz
    fastqc output_reverse_paired.fq.gz
    
    image.png image.png

    过滤之后,序列总的碱基数量和序列长度都有减少

    四、Spades组装基因组草图

    cd ncbi/public/sra
    spades.py --careful --pe1-1 SRR9209170_1.fastq.gz --pe1-2 SRR9209170_2.fastq.gz -o ./SPAdesout_9209170_new
    
    出现如下问题 image.png

    原因是内存不够,解决方法是关闭虚拟机,在设置里的系统里,增加内存


    image.png 结果就是contigs.fasta文件 image.png

    五、Quast评价组装的基因组效果

    1.在当前位置输入

    quast.py contigs.fasta -o quast_out
    
    结果如下 image.png image.png
    用浏览器查看html文件report.html image.png image.png

    相关文章

      网友评论

        本文标题:组装细菌基因组

        本文链接:https://www.haomeiwen.com/subject/qjqsgctx.html