美文网首页NAD-seq
circos绘图,基因密度及GC含量的计算

circos绘图,基因密度及GC含量的计算

作者: 花生学生信 | 来源:发表于2023-11-16 10:25 被阅读0次

    Circos是一种基因组可视化工具,可以用来绘制基因密度和GC含量的图。


    Fig1 c、e

    计算基因密度可以通过统计基因的数量来实现。可以使用基因注释数据库(如Ensembl、NCBI等)中提供的基因注释文件,通过解析文件获取基因的位置信息,然后统计基因的数量。

    计算GC含量可以通过统计DNA序列中G和C的数量来实现。可以使用基因组序列文件(如FASTA格式)中的DNA序列,通过解析序列文件,统计G和C的数量,然后计算GC含量。

    计算每条染色体长度
    samtools faidx IRGSP-1.0_genome.fasta 
    
    .fai
    滑窗
    bedtools makewindows -g IRGSP-1.0_genome.fasta.fai -w 1000000 >1M```
    
    计算每个滑窗内基因的数量
    grep -w "gene" Oryza_sativa.IRGSP-1.0.48.gff3 |awk '{print $1"\t"$4"\t"$5}'|uniq > gene.pos
    
    计算基因密度
    bedtools intersect -a 1M -b gene.pos -c >gene.density
    
    gene.desity
    计算GC含量
    seqkit sliding -s 1000000 -W 1000000 IRGSP-1.0_genome.fasta |seqkit fx2tab -n -g >gc
    
    gc含量

    相关文章

      网友评论

        本文标题:circos绘图,基因密度及GC含量的计算

        本文链接:https://www.haomeiwen.com/subject/sfvewdtx.html