美文网首页r语言学习r语言ggplot2绘图
R使用笔记: ggplot2的一顿骚操作...

R使用笔记: ggplot2的一顿骚操作...

作者: GPZ_Lab | 来源:发表于2018-05-05 16:09 被阅读691次

    本次笔记内容:

    • 使用ggplot2及ggrepel绘制主图和副图
    • 多种方法整合主图与副图:
      ggpubr: ggarange() , 副图注释在主图外
      ggplot2: ggplotGrob + annotation_custom, 副图注释在主图内
      ggExtra: ggMarginal(), 副图重叠注释在主图外
      cowplot: 副图注释在主图外
    • 总结:形式为功能服务,不要lost在细节的漩涡,但细节如何处理得心里有数。

    使用iris这个示例数据,用ggplot2画一个基本图。
    鸢尾花(iris)是数据挖掘常用到的一个数据集,有150个鸢尾花样本信息,包括3个物种(setosa,versicolour和virginica)。每个样本具有5个特征(Sepal.Length,Sepal.Width, Petal.Length, Petal.Width, Species)。

    data("iris")
    iris <- data.frame(iris)
    col <- brewer.pal(3, "Set1")
    ggplot(data = iris, aes(Sepal.Length, Sepal.Width, colour = Species)) + 
        geom_point(size = 5, alpha = .6) + 
        scale_color_manual(values = col)
    
    base
    使用ggplot2及ggrepel绘制主图和副图

    使用iris这个示例数据绘制主图和副图。在以下代码中我切了一个子数据集出来,并加上了一个‘group’列,作为演示ggrepel用。

    主图:
    # required packages
    library(RColorBrewer)
    library(ggrepel)
    library(ggpubr)
    library(cowplot)
    library(ggExtra)
    
    data("iris")
    iris <- data.frame(iris)
    iris_sub <- iris[iris$Sepal.Length > 2 & iris$Sepal.Width > 3.5, ]
    iris_sub$group <- c(rep('group1',10), rep('group2',9))
    
    col <- brewer.pal(3, "Set1")
    col1 <- brewer.pal(3,"Set3")[1:2]     
    
    # main scatter plot
    gg <- ggplot(data = iris, aes(Sepal.Length, Sepal.Width, colour = Species)) + 
      geom_point(size = 5, alpha = .6) + 
      scale_color_manual(values = col) +
      geom_label_repel(data = iris_sub, 
                       aes(
                         Sepal.Length, Sepal.Width, 
                         label=rownames(iris_sub), 
                         fill = group,
                         color = group
                         ),
                       color = 'black', alpha=1,
                       point.padding = unit(0.1,"lines"), 
                       box.padding = 0.5,
                       segment.color = 'grey55') +
                       # 连接label和点的线:颜色设置为gery55
      scale_fill_manual(values = setNames(col1, levels(iris_sub$group))) +
      # 将col1的两个颜色,设置为iris_sub的两个group的颜色,ggrepel按照这个颜色来fill
      theme(legend.position = "bottom")     
      # 把legend设置在底部,因为副图可能会遮盖住右边的Legend
    
    main scatter plot
    副图:
    # annotated plot
    xplot <- ggplot(data = iris, aes(x = Species, y = Sepal.Length, fill = Species)) + 
      geom_boxplot(position = position_dodge(0.8)) +
      geom_point(position = position_jitterdodge())+
      scale_fill_brewer(palette = "Set1") +
      coord_flip() +
      # 把竖着的boxplot横过来
      clean_theme() +
      # 去掉所有theme, 比如x和y轴,只留下box。在调整阶段可以先留着,以观察把主副图合并时有没有把坐标轴对齐
      theme(legend.position = "none")
      # 去掉lengend
    
    yplot <- ggplot(data = iris, aes(x = Species, y = Sepal.Width, fill = Species)) + 
      geom_boxplot(position = position_dodge(0.8)) +
      geom_point(position = position_jitterdodge())+
      scale_fill_brewer(palette = "Set1") +
      clean_theme() +
      theme(legend.position = "none")
    
    多种方法整合主图与副图:
    ggpubr: ggarange() , 副图注释在主图外
    ggarrange(xplot, NULL,gg,yplot, 
              widths = c(5,1),heights = c(1,4), align = "hv")
    

    ggarange()将副图整合在主图外部。如果把clean_theme()去掉,发现因为主图legend的缘故,副图的坐标轴没法和主图对齐。这里可能得根据实际情况调整主图的legend。ggarange()的好处在于可以调整整合图的比例,参数设置简单。

    ggplotGrob + annotaion_custom
    # ggplotGrob + annotaion_custom
    x_grob <- ggplotGrob(xplot)
    y_grob <- ggplotGrob(yplot)
    xmin <- min(iris$Sepal.Length)
    xmax <- max(iris$Sepal.Length)
    ymin <- min(iris$Sepal.Width)
    ymax <- max(iris$Sepal.Width)
    yoffset <- (1/20) * ymax
    xoffset <- (1/30) * xmax
    
    gg + annotation_custom(grob = x_grob, 
                           xmin = xmin, xmax = xmax, 
                           ymin = ymin-yoffset, ymax = ymin+yoffset) +
      annotation_custom(grob = y_grob,
                        xmin = xmin-xoffset, xmax = xmin+xoffset, 
                        ymin = ymin, ymax = ymax)
    

    ggGrob + annotation_custom()设置起来比较麻烦,其副图注释在主图内部。但存在一系列问题。坐标轴很难对齐,主图与副图重叠很多。所以实际操作起来,为避免图之间的overlap, 可能还是副图注释在主图外比较合适。

    ggExtra: ggMarginal()
    ggMarginal(gg, type = "boxplot",groupColour = TRUE, groupFill = TRUE)
    

    ggMarginal()可以用简洁的代码画出上述的图。注释在主图外,且坐标轴可以对齐。但副图之间有overlap...可能绘制可以重叠的分布曲线比较合适。我始终没有找到如何避免boxplot之间overlap的办法=_=
    ggMarginal()有个好处在于不需要画出副图,只需要主图。这个包会帮你直接绘制副图。但也意味着你没办法自定义副图的一些属性。

    cowplot
    p1 <- insert_xaxis_grob(gg, xplot, grid::unit(.2, "null"), position = "top")
    p2 <- insert_yaxis_grob(p1, yplot, grid::unit(.2, "null"), position = "right")
    ggdraw(p2)
    

    cowplot画出的图是我觉得比较满意的一种。副图注释在主图外,坐标轴对齐,代码简单,不用调试太多参数。

    p.s. 还有一个ggscatterhist() 可以试试
    http://www.sthda.com/english/articles/32-r-graphics-essentials/131-plot-two-continuous-variables-scatter-graph-and-alternatives/

    总结

    ....有时候很难找到一个合适的包,能满足所有的需求:副图和主图之间的空白不要那么大,坐标轴要互相对齐,box之间最好不要有overlap,lengend的位置不要影响到副图的位置...等等。图是为表达科学问题的一种形式,更好的反应出科学假设与结果才是作图的目的。一些代码难以处理的细枝末节可以在图的形式大致确定下来之后,使用其他图片编辑软件进行微调。

    参考链接:
    color filling in ggrepel:
    https://github.com/slowkow/ggrepel/issues/82
    https://stackoverflow.com/questions/37664025/ggrepel-label-fill-color-questions
    http://rstudio-pubs-static.s3.amazonaws.com/155546_17c0cb7ee350417e902dfb9031b81f48.html
    annotated to the main plot:
    http://www.sthda.com/english/wiki/wiki.php?id_contents=7930
    http://www.sthda.com/english/articles/24-ggpubr-publication-ready-plots/78-perfect-scatter-plots-with-correlation-and-marginal-histograms/
    http://www.r-graph-gallery.com/277-marginal-histogram-for-ggplot2/

    相关文章

      网友评论

      本文标题:R使用笔记: ggplot2的一顿骚操作...

      本文链接:https://www.haomeiwen.com/subject/spakrftx.html