相比于网页工具,使用编程语言处理科研数据的一大优势,在于高度的定制化,以及批量处理数据的快捷性和高效性
对于批量处理数据的方法,之前使用for循环和apply语句进行处理过,但是不够系统,学习果子生信课程后有一个清晰的认识,写下来,一是可以调用方便,二是自己写过之后,才能算是完全掌握。当然一切以解决问题为主,不陷于技术深究。
前面得到统计量之后,进行筛选,选择相应的数据做图
数据整理
rm(list = ls())
library(survminer)
data("myeloma")
head(myeloma)[1:3,1:11]
colnames(myeloma)
data = myeloma
还是使用R再带数据集
写一个画图函数
之所以提前写一个画图函数,这样就能保证在批量作图时影响一些标签
myboxplot <- function(gene){
ggboxplot(
data, x = "molecular_group", y = gene,
palette = "npg",fill = "molecular_group",
bxp.errorbar = T, bxp.errorbar.width = 0.2,outlier.shape = NA
)+
xlab(label = 'Molecular Group')+
ylab(label = paste(gene, ' Expression', sep = '\t'))+
rotate_x_text(angle = 45)+
stat_compare_means(aes(group=molecular_group),
label = "p.format",label.x =4, size = 4)+
theme(title = element_text(size = 18, color = "black", face = "bold"),
plot.title = element_text(hjust = 0.5,vjust = 0.5),
axis.text = element_text(size = 10, color = "black", face = "bold", vjust = 0.5, hjust = 0.5),
axis.line = element_line(size = 0.8),
legend.title = element_text(size = 9)
)
}
检验画图效果
myboxplot("CCND1")
这个是我自己使用的箱型图画图函数,后续细说一下其中的参数
设置图片存放位置
picDir <- './picture/'
if (!dir.exists(picDir)) {
dir.create(picDir)
}
这一步操作,还是有必要的,节省后续的校对
联合for循环批量出图
for (i in 6:length(colnames(data))) {
print(i)
inputgene = colnames(data)[i]
p = myboxplot(inputgene)
ggsave(p, filename = paste0(picDir, inputgene, '.pdf'), width = 7, height = 5)
}
这样一来,每一幅图的名称都明明白白的
完整操作代码
# 批量画图 --------------------------------------------------------------------
myboxplot <- function(gene){
ggboxplot(
data, x = "molecular_group", y = gene,
palette = "npg",fill = "molecular_group",
bxp.errorbar = T, bxp.errorbar.width = 0.2,outlier.shape = NA
)+
xlab(label = 'Molecular Group')+
ylab(label = paste(gene, ' Expression', sep = '\t'))+
rotate_x_text(angle = 45)+
stat_compare_means(aes(group=molecular_group),
label = "p.format",label.x =4, size = 4)+
theme(title = element_text(size = 18, color = "black", face = "bold"),
plot.title = element_text(hjust = 0.5,vjust = 0.5),
axis.text = element_text(size = 10, color = "black", face = "bold", vjust = 0.5, hjust = 0.5),
axis.line = element_line(size = 0.8),
legend.title = element_text(size = 9)
)
}
myboxplot("CCND1")
# 设置图片存放位置
picDir <- './picture/'
if (!dir.exists(picDir)) {
dir.create(picDir)
}
for (i in 6:length(colnames(data))) {
print(i)
inputgene = colnames(data)[i]
p = myboxplot(inputgene)
ggsave(p, filename = paste0(picDir, inputgene, '.pdf'), width = 7, height = 5)
}
后记:
出图的方式还是要构建函数+for循环
函数构建能够很大程度的简化代码,增加代码的迁移能力
构建函数,其实也就能够组装R包
后续增加如何利用循环批量的方法处理文件
网友评论