美文网首页
跟着Nature Microbiology学作图:R语言ggpl

跟着Nature Microbiology学作图:R语言ggpl

作者: 小明的数据分析笔记本 | 来源:发表于2021-11-27 21:56 被阅读0次

本地文件 s41564-021-00997-7.pdf

论文

Protective role of the Arabidopsis leaf microbiota against a bacterial pathogen

image.png

这篇论文中的数据是公开的,争取把论文中的图都复现一下,今天的推文复现Figure3 a 和 b ,这两个类型一样,都是柱形图

image.png

这里涉及到一个小知识点是:ggplot2用一组数据画柱形图,图上体现的是这组数据中每个数据出现的次数,比如

library(ggplot2)
df<-data.frame(x=1:10)
ggplot(data=df,aes(x=x))+
  geom_bar()
image.png

论文中提供的数据格式部分如下

image.png

论文中的图体现的是数值位于某个区间内的有多少个

首先是读入数据

因为这里还涉及到映射颜色,还需要用到figure1的数据集

library(tidyverse)
library(readxl)
df1<-read_excel("41564_2021_997_MOESM11_ESM.xlsx",
               sheet = "Fig3a")
df2<-read_excel("41564_2021_997_MOESM10_ESM.xlsx")

head(df1)
dim(df1)
head(df2)
dim(df2)

两个数据集根据指定的列合并

df<-merge(df1,df2,by.x = "Strain_ID",by.y = "Strain_ID") %>% 
  select(`mean Protection score [a.u.]`,
         Strain_ID,
         Phylum)
head(df)
dim(df)

对指定的列按照指定的区间分隔

df$new_col<-cut(df$`mean Protection score [a.u.]`,
                breaks = c(-10,seq(10,90,by=10),110),
                labels = 1:10)
df$new_col<-as.numeric(as.character(df$new_col))

准备颜色

colors<-c("#96d796","#aed75b","#599943",
          "#499ef1","#f18282","#ffdf33")

作图

library(ggplot2)
ggplot(data=df,aes(x=new_col))+
  geom_bar(width=1,
           aes(fill=Phylum))+
  scale_x_continuous(breaks = seq(0.5,10.5,by=1),
                     labels = seq(0,100,by=10))+
  scale_fill_manual(values=colors)+
  theme_bw()+
  theme(panel.grid = element_blank())+
  labs(x="Mean protection score (a.u.)",
       y="Number of strains")
image.png

这个和原文的图稍微有些不一样,因为没有搞清楚原文用到的映射颜色的数据用到是哪个

接下来是figure3b,思路是一样的

library(tidyverse)
library(readxl)
df1<-read_excel("41564_2021_997_MOESM11_ESM.xlsx",
                sheet = "Fig3b")
df2<-read_excel("41564_2021_997_MOESM10_ESM.xlsx")

head(df1)
dim(df1)
head(df2)
dim(df2)


df<-merge(df1,df2,by.x = "Strain_ID",by.y = "Strain_ID") %>% 
  select(`mean Colonization [log(CFU/mg)]`,
         Strain_ID,
         Phylum)
head(df)
dim(df)

df$new_col<-cut(df$`mean Colonization [log(CFU/mg)]`,
                breaks = c(-10,seq(1,7,by=1),110),
                labels = 1:8)
df$new_col<-as.numeric(as.character(df$new_col))

colors<-c("#96d796","#aed75b","#599943",
          "#499ef1","#f18282","#ffdf33")

library(ggplot2)
ggplot(data=df,aes(x=new_col))+
  geom_bar(width=1,
           aes(fill=Phylum))+
  scale_x_continuous(breaks = seq(0.5,8.5,by=1),
                     labels = seq(0,8,by=1))+
  scale_fill_manual(values=colors)+
  theme_bw()+
  theme(panel.grid = element_blank())+
  labs(x=expression("Mean colonization"*"("*log*"("*"c.f.u. mg"^"–1"*")"*")"),
       y="Number of strains")+
  ggsave(filename = "fig3b.pdf",
         width = 6,
         height = 4,
         family="serif")
image.png

这里多了一个知识点是坐标轴标题设置上标

最后是拼图

library(patchwork)

pdf(file = "fig3ab.pdf",
    width = 9.4,
    height = 4,
    family = "serif")

p1+p2+plot_layout(guides = "collect")+
  plot_annotation(tag_levels = 'a')
dev.off()
image.png

如果需要推文的示例数据和代码可以直接给推文打赏1元,如果打赏了没有收到我的回复,可以加我的微信mingyan24催我

欢迎大家关注我的公众号

小明的数据分析笔记本

小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!

相关文章

网友评论

      本文标题:跟着Nature Microbiology学作图:R语言ggpl

      本文链接:https://www.haomeiwen.com/subject/nncztrtx.html