前一篇推送的文章,作者用冲积图(桑基图)展示了基因表达量-可及性-组蛋白修饰的关系。本次推送将对冲积图(桑基图)展示具体的介绍。
冲积图与桑基图
冲积图(Alluvial plot):左右没有先后顺序,不存在箭头表示先后,左右的位置可以随意互换。
桑吉图(Sankey diagram):本质一种流程图,可以有箭头,表示从一个状态流到另一个状态。
该图以基因为单位。
Type_I:G3比Em染色质可及性高、H3K27me3低且表达上调的基因。
Type_II:G3比Em染色质可及性低、H3K27me3高且表达下调的基因,即文章中所说的“组蛋白修饰在基因表达中起着重要作用。特别是高水平的H3K27me3是植物基因沉默的标志。然而,H3K27me3的ChIP-seq数据显示,种子萌发后可及性水平降低的大多数峰与高水平的H3K27me3无关”对应部分。
Type_III:G3比Em染色质可及性更高/低、始终没有K27修饰、基因表达变化未定。
Other:除以上三种之外的所有。
因为是以基因为单位,转录水平定量比较简单,ATAC-seq和K27的ChIP-seq需要从区间定位到基因。
在线绘制桑基图
网址https://hiplot.com.cn/home/index.html
选择“桑基图”,可以绘制多列数据的关系。
用excel构建测试数据。
这篇文章的方法部分作者明确了是以基因为单位作图,所以在此之前我们需要定义哪些基因树与ATAC-seq 上调/下调,哪些是K27的Down/Up/Na/Ns,根据方法部分的描述,可以通过计算差异peak然后对差异peak进行注释来关联基因,可以根据之前的推送《生信分析7:如何利用ATAC-seq数据鉴定转录因子活性》学习。
第一步 导入数据
第二步 设置分组参数
第三步 设置通用参数,可以用默认参数。
然后点击提交即可。
输出结果可导出pdf等格式。
最后利用AI等软件去除Type列就是文章中的形式。
利用R语言绘制桑基图
网友评论