Circos是一种基因组可视化工具,可以用来绘制基因密度和GC含量的图。
Fig1 c、e
计算基因密度可以通过统计基因的数量来实现。可以使用基因注释数据库(如Ensembl、NCBI等)中提供的基因注释文件,通过解析文件获取基因的位置信息,然后统计基因的数量。
计算GC含量可以通过统计DNA序列中G和C的数量来实现。可以使用基因组序列文件(如FASTA格式)中的DNA序列,通过解析序列文件,统计G和C的数量,然后计算GC含量。
计算每条染色体长度
samtools faidx IRGSP-1.0_genome.fasta
.fai
滑窗
bedtools makewindows -g IRGSP-1.0_genome.fasta.fai -w 1000000 >1M```
计算每个滑窗内基因的数量
grep -w "gene" Oryza_sativa.IRGSP-1.0.48.gff3 |awk '{print $1"\t"$4"\t"$5}'|uniq > gene.pos
计算基因密度
bedtools intersect -a 1M -b gene.pos -c >gene.density
gene.desity
计算GC含量
seqkit sliding -s 1000000 -W 1000000 IRGSP-1.0_genome.fasta |seqkit fx2tab -n -g >gc
gc含量
网友评论