美文网首页作图
编译|mummer2circos画环状细菌基因组圈图

编译|mummer2circos画环状细菌基因组圈图

作者: zd200572 | 来源:发表于2024-03-28 22:42 被阅读0次

    mummer2circos 是一个用于绘制细菌基因组的圈图(circos图)的工具。它基于 BLAST 或 NUCMER/PROMER 的比对结果,生成 SVG 和 PNG 格式的图像,可以直观地展示基因组的结构和特征。

    安装

    方法一: 用conda

    先下载yaml文件,发现直接装conda直接conda装不行,因为依赖于blast等,测试环境windows,在wsl2上经过多次尝试,耗费时间很久,能docker还是docker


    许久还在转圈。。。
    conda install -c bioconda -c conda-forge mummer2circos

    方法二:Docker或类似的Singularity等容器方法

    # Docker
    windows下先根据官方说明安装docker desktop,然后打开,发现登陆账户由于国内网络原因很折腾,直接wsl命令行进行。
    sudo docker pull metagenlab/mummer2circos:1.4.2
    # Singularity
    # 准备镜像
    singularity build mummer2circos.simg docker://metagenlab/mummer2circos:1.4.2
    # 运行
    singularity exec mummer2circos.simg mummer2circos -r <reference.fna> -q <query.fna>  -l
    

    比对方法

    • 全基因组比对可以使用三种不同的方法完成:Megablast、Nucmer 或 Promer
    • 使用参数 -a 指示要使用的方法。Nucmer 是默认选项。
      mummer2circos -l -a promer ...

    简单图

    • -r 参考 fasta
    • -q 其他 fasta 与参考 fasta 进行比较
    • -l 建造圆形地块的修补选项
      基因组轨迹根据输入查询 FASTA 文件的顺序进行排序
    sudo docker run --rm -v /home/:/data -it metagenlab/mummer2circos:1.4.2
    (base) mambauser@8561c1b8f8de:/data$ mummer2circos -l -r source/mummer2circos/examples/genomes/NZ_CP008827.fna -q source/mummer2circos/examples/genomes/*fna -f
    14:07:36 INFO Genomes will be aligned with:     nucmer
    14:07:36 INFO Reference genome: source/mummer2circos/examples/genomes/NZ_CP008827.fna
    14:07:36 INFO running nucmer: nucmer -b 200 -c 65 -g 90 -l 20 -p circos_tmp/CP006659 source/mummer2circos/examples/genomes/NZ_CP008827.fna source/mummer2circos/examples/genomes/CP006659.fna
    ...
    14:09:08 INFO Query genome 10/10: source/mummer2circos/examples/genomes/NZ_FO834906.fna
    14:09:08 INFO Track file list ['CP006659.heat', 'KpFR_13.heat', 'NZ_CP008827.heat', 'NZ_CP008929.heat', 'NZ_CP012426.heat', 'NZ_CP012745.heat', 'NZ_CP014647.heat', 'NZ_CP015822.heat', 'NZ_CP016811.heat', 'NZ_FO834906.heat']
    14:09:08 INFO Plotting heatmap type plot...
    14:09:27 INFO Circos plot generated sucessfully, see nucmer2circos.svg & nucmer2circos.png
    14:09:27 INFO Circos files saved in circos_data:
            - main configuration file:              circos.config
            - Contigs definition:                   circos_contigs.txt
            - GC skew:                              circos_GC_skew.txt
            - GC content:                           circos_GC_content.txt
            - Heatmap track 1:                      CP006659.heat
            - Heatmap track 2:                      KpFR_13.heat
            - Heatmap track 3:                      NZ_CP008827.heat
            - Heatmap track 4:                      NZ_CP008929.heat
            - Heatmap track 5:                      NZ_CP012426.heat
            - Heatmap track 6:                      NZ_CP012745.heat
            - Heatmap track 7:                      NZ_CP014647.heat
            - Heatmap track 8:                      NZ_CP015822.heat
            - Heatmap track 9:                      NZ_CP016811.heat
            - Heatmap track 10:                     NZ_FO834906.heat
    14:09:27 INFO The plot can be modified (to change color scales, remove or add tracks...) by modifining the file "circos.config" and excuting the command "circos -conf circos.config"
    

    工作目录下,3种格式的图片已经生成啦!



    • -c 更紧实的环


    加上基因轨

    参考 Fasta 文件染色体(和最终质粒)的标题应与 GenBank 文件的位点加入相同。请参阅示例文件 NZ_CP008828.fna。
    LOCUS NZ_CP008828 15096 bp DNA CON 16-AUG-2015

    mummer2circos -l -r genomes/NZ_CP008827.fna -q genomes/*.fna -gb GCF_000281535_merged.gbk
    

    标记特定基因

    • 给定感兴趣的蛋白质的 FASTA 文件,在圆形图上标记每个氨基酸序列的 BBH
    • fasta 标头用作标签(请参阅示例文件 VF.faa)
    mummer2circos -l -r genomes/NZ_CP008827.fna -q genomes/*.fna -gb GCF_000281535_merged.gbk -b VF.faa 
    

    # 显示沿染色体(和质粒)的映射深度

    • 深度文件可以使用SamTools Depth从BAM文件生成
    • .depth 文件中使用的标签应与 Fasta 标头相同(请参阅示例文件)
    • 深度大于中位数 2 倍的区域被裁剪到该限制并着色为绿色(处理高度重复的序列)。
    • 深度低于中位深度一半的区域以红色着色。
    mummer2circos -l -r genomes/NZ_CP008827.fna -q genomes/*.fna -gb GCF_000281535_merged.gbk -b VF.faa -s GCF_000281535.depth
    

    根据坐标文件添加标签

    • 结构:LOCUS启动停止标签(见labels.txt)
    • 标签不能包含空格
    mummer2circos -l -r genomes/NZ_CP008827.fna -q genomes/NZ_FO834906.fna -gb GCF_000281535_merged.gbk -b VF.faa -s GCF_000281535.depth -lf labels.txt
    

    显示两个基因组之间的联系

    mummer2circos -r genomes/NZ_CP012745.fna -q genomes/*.fna -gb GCF_000281535_merged.gbk -b VF.faa -s GCF_000281535.depth -lf labels.txt
    

    One More Thing

    P.S.豆豆小编表示软件里的这个脚本mummer2circos/GC.py非常实用,计算GC和GC skew 这两个在比较基因组中经常使用,之前使用bedtools计算的,非常值得学习!

    相关文章

      网友评论

        本文标题:编译|mummer2circos画环状细菌基因组圈图

        本文链接:https://www.haomeiwen.com/subject/mpsutjtx.html