美文网首页作图
2024-03-01 全基因组circos图到底怎么画---使用

2024-03-01 全基因组circos图到底怎么画---使用

作者: Athena404 | 来源:发表于2024-02-29 18:56 被阅读0次

    circos可以说是基因组文章必备的主图了。现在也有好多教程,先分别探讨下个人喜好点。

    1. circos的软件。看官网的图,是不是非常酷炫。但是真正用好,研究明白会很痛苦。因为他的运行命令就只有circos circos.conf(忘了具体是啥 反正八九不离十),你要改图,你就要在conf文件里修改,改完了也不是即时生成,从vim编辑器里面出来再运行命令,但是实际上一个够用的基因组圈图根本用不上那么多功能。除了让你头痛....
      2.Tbtools的circos。优点是有教程,可以在windows系统操作,新手友好,缺点是,准备所有圈的文件比较复杂,比如窗口,基因密度,重复序列密度。共线性确实能画,但是上色比较麻烦,linux命令确实是比在excel里面操作方便非常多。
    2. R语言版本的circos。能画circos图的R包,目前我已知的有两个,一个是RCircos,另一个是circlize。据师兄说,前者比较旧,其他的应该没啥太大区别。我用的后者,基因密度,重复序列计数之类的基本不需要提,有个gff文件就搞定。

    所以,现在是service time!!!

    library(circlize)
    library(RColorBrewer)
    library(ComplexHeatmap)
    coul <- colorRampPalette(brewer.pal(9, "Set3"))(12)
    genome <- read.table('genome.txt')
    colnames(genome) <- c("chr","start","end")
    circos.par(start.degree = 90 , gap.degree = 3 )
    circos.genomicInitialize(genome)    ###生成最外圈的刻度
    
    # gc
    GC <- read.table('GC.txt')
    colnames(GC) <- c("chr","start","end","value")
    circos.genomicTrackPlotRegion(GC,track.height = 0.08, bg.border = NA,panel.fun = function(region, value, ...){
    circos.genomicLines(region, value, type = "l",col='#9370DB',...)})
    
    # gene
    gene <- read.table('gene.pos')[,c(1,2,3)]
    colnames(gene) <- c("chr","start","end")
    circos.genomicDensity(gene,col = c("#67a9cf80"), track.height = 0.08,border = NA)
    
    #repeat
    rep <- read.table('EDTA.repeat.bed')
    circos.genomicDensity(rep,col = c("#7fc97f"), track.height = 0.08,border = NA)
    #pseudochromosome
    circos.track(ylim = c(0, 1), bg.col =coul ,bg.border = NA, track.height = 0.05)
    
    #co-line
    ###result of jcvi
    bed<-read.table('anchor.loc.txt')
    bed$diff <- bed$V3 - bed$V2
    condition <- bed$diff > 1000000
    filtered_bed <- bed1[condition, ]
    bed1 <- filtered_bed[, c("V1", "V2", "V3")]
    bed2 <- filtered_bed[, c("V4", "V5", "V6")]
    #bed1<-read.table('bed1')
    #bed2<-read.table('bed2')
    #bed1$color <- factor(bed1$V1, levels = unique(bed1$V1), labels = coul)
    
    circos.genomicLink(bed1, bed2, border = NA,col = rand_color(nrow(bed1), transparency = 0.5))
    
    #end
    circos.clear()
    dev.off()
    ##文件夹里面的Rplot.pdf就是圈图的结果
    

    看到了么,只需要提供scaffold号,起始位置,终止位置,你就可以得到密度数据,真的绝。
    他是从最外圈往最内圈画的。track.height 就是每一圈的厚度。请把你们的颜色改成和我不一样的,谢谢。
    我知道我知道,光给你代码是不够的,要告诉你输入文件长什么样。

    > head(genome)
          chr start      end
    1 Hb_chr1     1 46819076
    2 Hb_chr2     1 44587488
    3 Hb_chr3     1 41112232
    4 Hb_chr4     1 39704978
    5 Hb_chr5     1 39509855
    6 Hb_chr6     1 37849917
    > head(GC)
          chr  start    end   value
    1 Hb_chr1      0 100000 0.38155
    2 Hb_chr1 100000 200000 0.39211
    3 Hb_chr1 200000 300000 0.38441
    4 Hb_chr1 300000 400000 0.42246
    5 Hb_chr1 400000 500000 0.39622
    6 Hb_chr1 500000 600000 0.38849
    > head(gene)
                   chr start   end
    1 Hb_chr1 20876 21295
    2 Hb_chr1 21412 21561
    3 Hb_chr1 24046 30936
    4 Hb_chr1 40594 40995
    5 Hb_chr1  2049  2582
    6 Hb_chr1 14162 14959
    > head(rep)
           V1    V2    V3
    1 Hb_chr1 10851 10934
    2 Hb_chr1 18742 19717
    3 Hb_chr1 19897 20390
    4 Hb_chr1 19978 20483
    5 Hb_chr1 20567 21012
    6 Hb_chr1 21934 23671
    > head(bed)
           V1       V2       V3      V4       V5       V6    diff
    1 Hb_chr1   650547  1097241 Hb_chr1 40863110 41088941  446694
    2 Hb_chr1  1843619  2150420 Hb_chr1 42629387 42953008  306801
    3 Hb_chr1  2376475  2751376 Hb_chr1 18273955 19048666  374901
    4 Hb_chr1 10209948 11765425 Hb_chr1 37476684 37791036 1555477
    5 Hb_chr1 10676780 12179670 Hb_chr1 45830252 46061452 1502890
    6 Hb_chr1 16253223 18786887 Hb_chr1 39243966 40042787 2533664
    

    有人不知道bed文件怎么来的。好吧,就是jcvi生成的anchor,具体怎么做,看我下一篇文章吧。。。
    推荐一个配色网站:
    https://colorbrewer2.org/#type=qualitative&scheme=Pastel1&n=6

    个人感悟:最开始学的是linux命令,喜欢写 shell脚本,年纪大了,学完一种语言之后,就不想学新的语言了,对R语言就比较抵触,想着有gpt,不会也没关系。当时想的是,要不我把软件版的circos学会了,得多厉害,以后专门帮别人画圈图,一张五十,饭钱就来了。但是....真的好难。circlize包真的太简单了。两天足够你从入门到精通(基因组)。以后再有图要画也不慌了。R也是好东西啊哈哈哈哈哈。

    相关文章

      网友评论

        本文标题:2024-03-01 全基因组circos图到底怎么画---使用

        本文链接:https://www.haomeiwen.com/subject/iouqzdtx.html