组学数据为揭示生物学规律提供了有效方式。在基于组学的差异表达分析时需要将统计学方法和可视化结果相结合,来阐述分析结果。今天介绍一下基于组学的差异分析中涉及到的各种可视化表达方式。
1. 柱状图
柱状图通过高度对比直观展示数据间差别,可以用于描述两组数据的平均值的差异性。通常柱状图上方根据标注差添加Bar。
2. 盒图、小提琴图:
柱状图主要描述平均值大小,无法反映出数据整体分布情况,这时我们可以采用盒图和小提琴图。盒图又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。利用盒图可以清晰显示两组不同条件下获得的组学数据中某个基因/代谢物等生物分子的差异表达情况。
小提琴图:跟箱形图类似,但是在密度层面展示更好。在数据量非常大不方便一个一个展示的时候小提琴图特别适用。
利用R语言ggplot2包可以轻松实现上述统计图形的绘制。
模拟数据
图.1 图.2由于ggplot2包基于dataframe数据结构进行绘图,所以转换数据格式:
图.3a. 绘制柱状图
图.4b. 盒图与小提琴图
盒图和小提琴图需要根据原始数据对数据分布情况进行可视化,因此不需要提前进行均值、方差计算,需要给出数据值及数据所对应的对比条件。
图.5绘制盒图
图.6 图. 7同时,我们可以设定盒图上是否以散点图形式同时显示原始数据分布
图. 8 图. 9小提琴图绘制:
图. 10 图. 11
网友评论