美文网首页小教程收藏生物信息学与算法科研信息学
可视化motif logo三种方法(seqLogo/ggseql

可视化motif logo三种方法(seqLogo/ggseql

作者: 生信编程日常 | 来源:发表于2020-04-09 17:11 被阅读0次
    1. seqLogo

    seqLogo是1990年发表的一个可视化工具,还是基于grid作图的工具。可以输入从MEME,JASPAR等数据库下载的PPM矩阵(需把header处理掉),即可出图。

    # 安装
    source ( "http://bioconductor.org/biocLite.R" )
    biocLite("seqLogo")
    
    # 导入CTCF的PPM矩阵
    library(seqLogo)
    ctcf <- read.table('~/Documents/writethings/20200409/ppm.txt', header = F)
    
    # 转为PWM矩阵(转置是因为必须要让行分别是ATCG的PWM score)
    trans_ctcf <- makePWM(t(ctcf))
    seqLogo(trans_ctcf)
    

    可输出:


    seqLogo

    如果想要在一张上输出多张图的话(参考https://support.bioconductor.org/p/35240/
    ):

    bad = (sapply( body(seqLogo), "==", "grid.newpage()") |
            sapply( body(seqLogo), "==", "par(ask = FALSE)"))
    body(seqLogo)[bad] = NULL
    tf_names <- c('CTCF', 'SP1')
    grid.newpage()
    for(i in 0:1){
    
       ppm <- read.table(paste('~/Documents/writethings/20200409/ppm',i+1 ,'.txt', sep = ''), header = F)
       pwm <- makePWM(t(ppm))
    
       pushViewport(viewport(x=0.25+0.55*(i%%2),
                             y=0.5+0.55*(i%/%2),
                             width=0.5, height=0.6))
       seqLogo(pwm)
       grid.text(tf_names[i+1], x=0.5, y=1,
                 hjust=0.5, vjust=1)
       popViewport()
    
    }
    
    multi_logo
    1. ggseqlogo

    这个工具是2017年发在bioinformatics上R包,基于ggplot作图。可以输入序列、PFMS和PPM等。

    library(ggseqlogo)
    ppm <- t(ppm) 
    rownames(ppm) <- c("A", "G", "C", "T")
    ggseqlogo(ppm)
    

    输出:


    ggseqlogo

    功能较多,详细可参考手册:https://omarwagih.github.io/ggseqlogo/

    1. LogoJS
      网址:https://logojs.wenglab.org/app/
      home
      home

    可以选择提交文件还是粘贴矩阵,文件中可以包括多个转录因子矩阵,输出:


    LogoJS

    相关文章

      网友评论

        本文标题:可视化motif logo三种方法(seqLogo/ggseql

        本文链接:https://www.haomeiwen.com/subject/fivcmhtx.html