欢迎关注”生信修炼手册”!
DNA甲基化作为表观遗传的一种重要标记,在基因表达调控中发挥重要作用,已有研究表明,位于启动子区的甲基化会抑制基因表达。结合甲基化数据和基因表达谱数据,可以更好的分析甲基化的调控功能。
通过TCGAbiolinks不仅仅可以对某种类型的数据进行分析,还可以进行多组学数据的联合分析,DNA甲基化和基因表达谱数据的联合分析过程如下
1. 甲基化芯片数据
以肾上腺皮质癌为例,首先从TCGA数据库下载450K甲基化芯片的数据,分析后得到差异甲基化位点
差异甲基化位点的火山图结果如下
2. 基因表达谱数据
首先下载数据
然后进行差异分析,代码如下
差异基因火山图的绘制代码如下
效果图如下所示
3. 联合分析
starburst plot是联合分析最常用的可视化方法,代码如下
生成的效果图如下
这里采用了差异分析的FDR值来绘制图片,其他文章中也有采用fold change来绘制该图的,因为根据fold change的大小更好判断差异表达的趋势,根据FDR值只能判断是否显著差异。
在DNA甲基化和基因表达谱的联合分析中,鉴于DNA甲基化抑制基因表达的思想,通常关注二者间为负相关的位点,即甲基化下调而基因上调,甲基化下调基因上调的相关位点。在上图中,显著差异且存在负相关的位点用圆圈进行了标注。
通过TCGAbiolinks可以轻松实现DNA甲基化和基因表达谱数据的联合分析,美中不足的是它的starburst plot没有采用常用的fold change来绘制。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!
网友评论