美文网首页生信分析流程GSEA
GSEA富集分析的点状图画法(R)

GSEA富集分析的点状图画法(R)

作者: 欧阳松 | 来源:发表于2020-03-02 00:25 被阅读0次

GSEA运行完以后默认出图较丑,而且只是png格式,不能改字体和大小,分辨率还是可怜的96dpi,就像下面这个图,远看可以,近看不行,远达不到SCI要求。

但其实知道原理的话,就是各种Excel表而已,有再次画曲线的,有再次绘制的,当然也可以画成Y叔clusterprofiler那样富集分析的柱状图和点状图,今天就介绍我最喜欢的点状图。
首先看表格内容,打开生成的文件夹,找到excel文件,主要是gsea_report_for_High_1574441392886.xlsgsea_report_for_Low_1574441392886.xls,具体文件名是看你自己定义的亚型和文件夹名,前缀是gsea_report_for_xx_yyxx是亚型,yy是文件夹名
比如你要分析其中的一个亚型,打开excel
表头显示如下

表头

仔细分析,我们需要的部分为NAME, SIZE,NES,NOM p-val,FDR q-val
一般有统计学意义的定义是NES>1或<-1及NOM p-val<0.05及FDR q-val<0.25,三者缺一不可,但是也可以只看p值或NES,看你需要什么样的结果,就保留什么结果,不然内容太多,也不好画图,我觉得10项就差不多了。

NAME里面有很少下划线,影响后期作图,所以建议画图前先处理,把前缀如“KEGG_”替换为空,把_替换成空格,(是空格,不是空,不把_后面替换为空格,后面无法改文本的长度),当然你可以把大小写改了,由于xls直接加载麻烦,所以建议保存为csv格式,一般不建议txt格式,因为csv读表直接有表头,可以省一点代码。
下面开始表演
打开Rstudio,加载目标文件夹

setwd("/Users/mac/Desktop/1574441392886/L/KEGG.Gsea.1574441392886/L") #自己看目录
#读表
kegg<-read.csv("kegg.csv")
kegg=as.data.frame(kegg)  #变矩阵,这行可以不执行
library(ggplot2) #加载神器
readcsv.jpeg

默认出图

p<-ggplot(kegg,aes(NES,NAME))+geom_point(aes(size=SIZE,color=NOM.p.val))
p
默认图,是不是一模一样了,但很丑

改颜色

#最少是红,最高是蓝,当然自己都可以改其他颜色,如绿色到紫色
p+scale_color_continuous(low='red' ,high='blue')
好看多了

改背景,最喜欢的bw

p+scale_color_continuous(low='red' ,high='blue')+theme_bw()
清清爽爽

是不是觉得文本太长了,缩短文本就可以了,比如我们想显示20个字母一行

library(stringr) #加载这个
p+scale_color_continuous(low='red' ,high='blue')+theme_bw()+scale_y_discrete(labels=function(y) str_wrap(y,width = 20))
缩短文本长度

是不是觉得点太小了,当然可以增大点,比如由5号到10号,记得不要贪大哦!

p+scale_color_continuous(low='red' ,high='blue')+theme_bw()+scale_y_discrete(labels=function(y) str_wrap(y,width = 20))+scale_size(range = c(5,10))
大大的点

一般GSEA有两个亚型,能不能一起显示?
答案是当时可以,打开另一个表,把需要的内容复制到原来的表,最后一例加一列,定义为phenotype即可,把自己定义的亚型填好,比如我的是High和Low,然后保存重新读一下表,重新画一下图,大于1为正,小于1为负。

kegg<-read.csv("kegg.csv")
p+scale_color_continuous(low='red' ,high='blue')+theme_bw()+scale_y_discrete(labels=function(y) str_wrap(y,width = 20))+scale_size(range = c(5,10))
两个亚型
当然也可以分面显示的
#分面显示一行
kegg<-read.csv("kegg.csv")
p+ facet_wrap(phenotype~.,scale="free")+scale_color_continuous(low='red' ,high='blue')+theme_bw()+scale_y_discrete(labels=function(y) str_wrap(y,width = 20))+scale_size(range = c(5,10))
行分面

也可以列分面

#分面显示一列
p+ facet_grid(phenotype~.,scale="free")+scale_color_continuous(low='red' ,high='blue')+theme_bw()+scale_y_discrete(labels=function(y) str_wrap(y,width = 20))+scale_size(range = c(5,10))
列分面

按照这个原理,如果做了多个分析,如GO,HALLMARK,reactome什么的,都可以往下添加,记得后面加一列分组,把内容加一下就好了,代码是一样的。

什么?不知道怎么导图?

ggsave("gsea.pdf",width=8,height=8)

宽和高自己慢慢调吧,图就在你的目录文件夹里

当然可以画柱状图,但是柱状图的信息要少一点,比如不能看size,而且图也比较丑,建议还是点状图。

写完睡觉!!

相关文章

  • GSEA富集分析的点状图画法(R)

    GSEA运行完以后默认出图较丑,而且只是png格式,不能改字体和大小,分辨率还是可怜的96dpi,就像下面这个图,...

  • R实战 | 森林图绘制

    R实战 | 森林图绘制 回答一下R绘图实战|GSEA富集分析图 - 知乎 (zhihu.com)[https://...

  • 专题:富集分析

    GSEA基因集富集分析 1、用clusterProfiler做GSEA - 简书 2、GSEA-基因集富集分析 -...

  • GASE相关知识(Linux)

    (Gene Set Enrichment Analysis,GSEA) GSEA概念: GSEA:(基因集富集分析...

  • 富集高级可视化大全

    最全的GO, KEGG, GSEA分析教程(R),你要的高端可视化都在这啦![包含富集圈图] - 糖糖家的老张的文...

  • GSEA基因集富集分析

    生信宝典之前总结了一篇关于GSEA富集分析的推文——GSEA富集分析:从概念理解到界面实操 ,介绍了GSEA的定义...

  • R做GSEA富集分析

    首先感谢Y叔的clusterprofiler神包,做富集分析优点是在线爬取数据,结果很可信,但是缺点也是网络问题,...

  • 富集分析

    写在前面: 1某些富集代码 |关于GSEA|某些主流富集分析工具 两类富集分析 A:差异基因富集分析(不需要...

  • 单细胞之富集分析-5:一张图展示多组富集分析结果

    单细胞富集分析系列: 单细胞之富集分析-1:单细胞GSEA分析流程[https://www.jianshu.com...

  • 单细胞之富集分析-6:PROGENy

    单细胞富集分析系列: 单细胞之富集分析-1:单细胞GSEA分析流程[https://www.jianshu.com...

网友评论

    本文标题:GSEA富集分析的点状图画法(R)

    本文链接:https://www.haomeiwen.com/subject/skrdhhtx.html