美文网首页NGS
Heatmap——热图那些事

Heatmap——热图那些事

作者: young5100 | 来源:发表于2020-10-17 22:59 被阅读0次

    1.用gplots-heatmap.2画热图,

    library(gplots)
    library(RColorBrewer)
    setwd("D:\\生信课题\\R语言画图\\R语言统计与分析")
    #读取数据,txt文档为例,各种读取文档的方法请参考help
    #处理数据,如果第一行为名称时,不要第一行,提取行名
    datExp1 = datExp[, -1]
    rownames(datExp1) = datExp[, 1]
    #读取患者分组信息,设置分组颜色,橙色与蓝色
    datTraits = read.table('samplegroup.txt',sep='\t',header=T)
    color = factor(datTraits$group,labels=c('orange','blue'),levels = c("P","N"))
    #数据转换为矩阵
    datExp1 = as.matrix(datExp1)
    #聚类热图
    heatmap.2(datExp1,col = bluered(75),Colv = NA, 
              hclust=function(x) hclust(x,method = 'ward.D2'),
              distfun=function(x) dist(x,method='euclidean'),
              scale = "row",dendrogram = 'row',
              key = TRUE, symkey = FALSE, density.info = "none",
              trace = "none", cexRow = 0.5,
              ColSideColors = as.character(color),
              main = "Heatmap")
    

    注脚:
    scale标准化,根据每列或者行数据的均值标准化,主要是为了防止单个数据过大(过小),导致冷热色分布不明显的现象,可选row,column,none。
    **key 是否需要图标以及图标大小,key=T或者F,keysize=1.5;
    Colv=NA表示不对行聚类,Rowv=NA不对列聚类
    dendrogram=‘column’or 'none'or'row' or"both"显示聚类树状图,
    trace,是否需要基准线(均值,方差之类的),trace="both","row" 或者"column"
    density.info指示图内的线, density.info='none'
    cexCol=1,cexRow=1 设置xlab和ylab的字符大小
    #col,优化颜色:redgreen或者greenred, 调整配色,括号内表示这个配色区间分成多少格区分度; breaks=seq自己设置颜色分度breaks=seq(-5, 5, 1))
    ** labels,labCol
    调整每列的标记 labCol = NA,或者 labCol = c('Age', 'A', 'B', 'C'))
    margins 调整画布边距; margins=c(5,5),
    main='Heatmap'增加标题。

    2、用pheatmap画图,参考卖萌哥的——用pheatmap画热图 - 简书

    rm(list = ls())
    #获取当前工作目录
    getwd()
    #设置工作目录
    setwd("D:\\生信课题\\R语言画图\\R语言统计与分析\\梁荣朴给的练习数据")
    #加载包
    library(RColorBrewer)#**设置颜色用的,
    #关于RColorBrewer请参考——[RColorBrewer与ggplot2 - 简书](https://www.jianshu.com/p/a8856757a0d2)**
    library(pheatmap)
    #设置配色方案,为RColorBrewer,具体颜色方案放置备注里
    cc = colorRampPalette(rev(brewer.pal(n=8, name="Reds")))
    #读取文档,txt为例,卖萌哥的以csv为例,转化为矩阵
    dat = read.table('IL.txt',sep='\t',header=T)
    colnam=dat[,1]#设置行名,以便后面设置行名标签,labels_row = colnam
    dat1=dat[,-1]
    IL=as.matrix(dat1)
    #绘图
    heatmap=pheatmap(IL,color = cc(100),
                    main="IL",
                    fontsize = 15,
                    scale="row",
                    border_color = NA,
                    na_col = "grey",
                    cluster_rows = T,cluster_cols = F,
                    labels_row = colnam,
                    show_rownames = T,show_colnames = T,
                    treeheight_row = 30,treeheight_col = 30,
                    cellheight = 15,cellwidth = 30,
                    cutree_row=2,cutree_col=2,
                    display_numbers = F,legend = T,
                    filename = "IL-10-07.pdf")
    

    注脚:
    第一个参数是需要用pheatmap画图的数据
    color: 设置颜色。精细程度按照括号内设置的数值来定
    main: 标题名称
    fontsize: 设置row的字体大小
    scale: 设置归一化为正态分布,可选row,column,none。
    border_color: 是否显示边框及边框的颜色,NA不显示,red显示红色。支持简单的颜色单词
    na_col: 设置缺失值的颜色,支持简单颜色单词,一般设置为灰色就满好识别的。
    cluster_rows&cluster_cols: 设置是否对行或者列进行聚类,按照实际需求设置。当缺失值较多的时候是无法进行聚类的。**一个解决办法是读取数据的时候不设置缺失值。
    show_rownames&show_colnames: 是否显示行/列的名称
    treeheight_row&treeheight_col: 当前面设置了聚类之后,两边会出现聚类的树,这个参数是设置树的高度的。
    cellheight&cellwidth: 设置每个各自格的宽度和高度。
    cutree_row&cutree_col: 是否根据聚类情况把树切开,可以设置切开的份数。
    display_numbers: 设置是否显示每个单元格的值。
    legend: 设置是否显示旁边的bar状图例。
    filename: 设置输出文件的名字。可以设置的文件类型有:pdf,png,jpg,tiff,bmp。


    3、在线工具

    3.1、Expression Heat Map,操作参考在线绘制聚类热图(heatmapper) - 组学大讲堂问答社区

    优点:1、支持多种的颜色配置;2、支持样品和基因的双聚类;
    缺点:基因名称显示似乎不太行,还在尝试,数据上限:2,500 rows and 300 columns;

    3.2、Morpheus

    操作参考-没有,慢慢摸索就好,简单易上手,似乎没有数据上限?

    3.3、Matrix2png,操作参考:一个在线绘制热图的工具 - 生信人(生物信息学)问答平台

    似乎全英,看着好累

    3.4、https://www.omicstudio.cn/tool/4联川生物-

    这个工具看着也蛮好用的,操作参考也很详细,全中文参考:重磅推荐,超详细热图在线绘制教程资料! - 简书,不过我不想注册,就没尝试

    相关文章

      网友评论

        本文标题:Heatmap——热图那些事

        本文链接:https://www.haomeiwen.com/subject/xcfqmktx.html