1.示例数据
在公众号回复:dexp.csv,获得示例数据。
读取数据:
dexp <- read.csv("dexp.csv",row.names = 1)#设置第一列为行名
示例数据:40个基因,每个基因9个重复,加上这9个重复各自的观测值,以及每个基因的长度。
2.变量
(1)离散型变量
(2)连续型变量
3.几个重要概念
作图先要指定使用哪个数据集,然后指定xy轴。
(1)图层:不同的几何对象、图形元素的叠加方式,代码定义图层之间 用+连接
- 个体几何对象:
- 群组几何对象:需要设置group,默认是使用过的离散型变量
(2)aes(映射):建立数据与几何图形之间的关系
映射类型:
- 颜色类:color(颜色或边框颜色)、fill(填充颜色)和 alpha(透明度)
- 形状类:linetype(线型)、size(点的大小或线的宽度)和 shape(形状)
- 位置类:x, y, xmin, xmax, ymin, ymax, xend, yend
- 特殊类:一类是group和order,另一类是字符串映射
(3)几何对象:对映射的渲染或展示
geom_几何图形:
- geom_point:点图
- geom_line:折线图
- geom_area:面积图
- geom_bar:直方图
4.最简单的图
(1)点图
ggplot(data=dexp,aes(x=Gene,y=Expression,color=Sample))+
geom_point()
点图
(2)折线图
ggplot(data=dexp,aes(x=Sample,y=Expression,color=Gene))+
geom_line(aes(group=Gene))
折线图
(3)箱线图
ggplot(data=dexp,aes(x=Gene,y=Expression,color=Gene))+
geom_boxplot(aes(group=Gene))
箱线图
(4)密度图
p_density <- ggplot(data = dexp)+
geom_density(aes(Expression, color = Gene))
(5)小提琴图
ggplot(data = dexp,aes(x = Gene, y = Expression)) + geom_violin(
aes(fill = Group,color=Group)
)
被挤扁了的小提琴图
正常的小提琴图应该长这样
代码是:
ggplot(data = dexp,aes(x = Sample, y = Expression)) + geom_violin(
aes(fill = Group,color=Group)
(其实只是改了纵坐标)
(6)合并显示
library(gridExtra)
grid.arrange(p_plot,p_line,p_density, p_boxplot, p_violin,nrow=3)
合集
(7)大招:一键脚本
#点图
p_plot <- ggplot(data=dexp,aes(x=Gene,y=Expression,color=Sample))+
geom_point() #right
#折线图
p_line <- ggplot(data=dexp,aes(x=Sample,y=Expression,color=Gene))+
geom_line(aes(group=Gene))#right
#箱线图
p_boxplot <- ggplot(data=dexp,aes(x=Gene,y=Expression,color=Gene))+
geom_boxplot()
##密度图
p_density <- ggplot(data = dexp)+
geom_density(aes(Expression, color = Gene))
##小提琴图
p_violin <-ggplot(data = dexp,aes(x = Sample, y = Expression)) + geom_violin(
aes(fill = Group,color=Group)
)
library(gridExtra)
grid.arrange(p_plot,p_line,p_density, p_boxplot, p_violin,nrow=3)
优化方法将在后续笔记中展示。
网友评论