- 跟着Nature microbiology学作图:R语言ggpl
- 跟着Nature Microbiology学作图:R语言ggpl
- 跟着Nature Microbiology学作图:R语言ggpl
- 跟着Nature microbiology学画图~R语言ggpl
- 跟着Nature microbiology学画图~R语言ggpl
- 跟着Nature microbiology学画图~R语言ggpl
- 跟着Nature microbiology学画图~R语言ggpl
- 跟着Nature microbiology学画图~R语言ggpl
- 跟着GlobalChangeBiology学作图:R语言ggpl
- 跟着Nature Communications学作图:R语言gg
本地文件 s41564-021-00997-7.pdf
论文
image.pngProtective role of the Arabidopsis leaf microbiota against a bacterial pathogen
这篇论文中的数据是公开的,争取把论文中的图都复现一下,今天的推文复现Figure3 a 和 b ,这两个类型一样,都是柱形图
image.png这里涉及到一个小知识点是:ggplot2用一组数据画柱形图,图上体现的是这组数据中每个数据出现的次数,比如
library(ggplot2)
df<-data.frame(x=1:10)
ggplot(data=df,aes(x=x))+
geom_bar()
image.png
论文中提供的数据格式部分如下
image.png论文中的图体现的是数值位于某个区间内的有多少个
首先是读入数据
因为这里还涉及到映射颜色,还需要用到figure1的数据集
library(tidyverse)
library(readxl)
df1<-read_excel("41564_2021_997_MOESM11_ESM.xlsx",
sheet = "Fig3a")
df2<-read_excel("41564_2021_997_MOESM10_ESM.xlsx")
head(df1)
dim(df1)
head(df2)
dim(df2)
两个数据集根据指定的列合并
df<-merge(df1,df2,by.x = "Strain_ID",by.y = "Strain_ID") %>%
select(`mean Protection score [a.u.]`,
Strain_ID,
Phylum)
head(df)
dim(df)
对指定的列按照指定的区间分隔
df$new_col<-cut(df$`mean Protection score [a.u.]`,
breaks = c(-10,seq(10,90,by=10),110),
labels = 1:10)
df$new_col<-as.numeric(as.character(df$new_col))
准备颜色
colors<-c("#96d796","#aed75b","#599943",
"#499ef1","#f18282","#ffdf33")
作图
library(ggplot2)
ggplot(data=df,aes(x=new_col))+
geom_bar(width=1,
aes(fill=Phylum))+
scale_x_continuous(breaks = seq(0.5,10.5,by=1),
labels = seq(0,100,by=10))+
scale_fill_manual(values=colors)+
theme_bw()+
theme(panel.grid = element_blank())+
labs(x="Mean protection score (a.u.)",
y="Number of strains")
image.png
这个和原文的图稍微有些不一样,因为没有搞清楚原文用到的映射颜色的数据用到是哪个
接下来是figure3b,思路是一样的
library(tidyverse)
library(readxl)
df1<-read_excel("41564_2021_997_MOESM11_ESM.xlsx",
sheet = "Fig3b")
df2<-read_excel("41564_2021_997_MOESM10_ESM.xlsx")
head(df1)
dim(df1)
head(df2)
dim(df2)
df<-merge(df1,df2,by.x = "Strain_ID",by.y = "Strain_ID") %>%
select(`mean Colonization [log(CFU/mg)]`,
Strain_ID,
Phylum)
head(df)
dim(df)
df$new_col<-cut(df$`mean Colonization [log(CFU/mg)]`,
breaks = c(-10,seq(1,7,by=1),110),
labels = 1:8)
df$new_col<-as.numeric(as.character(df$new_col))
colors<-c("#96d796","#aed75b","#599943",
"#499ef1","#f18282","#ffdf33")
library(ggplot2)
ggplot(data=df,aes(x=new_col))+
geom_bar(width=1,
aes(fill=Phylum))+
scale_x_continuous(breaks = seq(0.5,8.5,by=1),
labels = seq(0,8,by=1))+
scale_fill_manual(values=colors)+
theme_bw()+
theme(panel.grid = element_blank())+
labs(x=expression("Mean colonization"*"("*log*"("*"c.f.u. mg"^"–1"*")"*")"),
y="Number of strains")+
ggsave(filename = "fig3b.pdf",
width = 6,
height = 4,
family="serif")
image.png
这里多了一个知识点是坐标轴标题设置上标
最后是拼图
library(patchwork)
pdf(file = "fig3ab.pdf",
width = 9.4,
height = 4,
family = "serif")
p1+p2+plot_layout(guides = "collect")+
plot_annotation(tag_levels = 'a')
dev.off()
image.png
如果需要推文的示例数据和代码可以直接给推文打赏
1元
,如果打赏了没有收到我的回复,可以加我的微信mingyan24
催我
欢迎大家关注我的公众号
小明的数据分析笔记本
小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!
网友评论