clusterProfiler：基因功能富集分析的惊喜之作

作者: KS科研分享与服务 | 来源:发表于2021-11-29 15:59 被阅读0次

clusterProfiler：基因功能富集分析的惊喜之作
GO和KEGG富集分析及去冗余工具及原理
本体论
ggplot2绘制GO富集分析柱状图
R 实战 | 使用clusterProfiler进行多组基因富集
小麦的GO富集分析
专题：富集分析
基因功能富集方法和基因注释数据库介绍
clusterProfiler基因功能富集分析 +气泡图
基因富集分析

转录组、蛋白组等测序结束后，筛选差异基因之后需要做的第一步工作可能就是需要功能富集，看基因的作用。做富集的工具也有很多，在线的工具也有大批，但是总体来说更新较慢，可视化操作不是很强。

R语言成了很多人的选择，在众多的包中，clusterProfiler无疑对我来说最具有亮点，可以结合可视化的包，做出好的结果。

（不教数据结构讲代码的都是耍流氓，我们公众号主力于初学者学习，手把手从第一步开始，保证清楚明白，不设坑）

首先，一般做完差异基因分析，我们会得到这样一个表格

image.png

接下来设定阈值，筛选差异基因

p_val_adj = 0.03 
avg_log2FC = 0.8
diff_signif = Ld[(Ld$p_val_adj< p_val_adj & abs(Ld$avg_log2FC)>avg_log2FC),]                    
diff_signif = diff_signif[order(diff_signif$avg_log2FC),]
UP  <- diff_signif[diff_signif$avg_log2FC>0, ] #上调的基因，下调的同理，FC小于0

要做差异基因，需要讲genesymbol转为ID

library(org.Mm.eg.db)
Up <- bitr(row.names(UP), fromType="SYMBOL", 
            toType="ENTREZID", 
            OrgDb="org.Mm.eg.db")

转完后得到这样一个文件：

image.png

这样就可以进行富集分析，首次使用clusterProfiler需要安装，按照如下代码

install.packages("devtools")
devtools::install_github('GuangchuangYu/clusterProfiler')
library(clusterProfiler)
library(enrichplot)#用于可视化的包

富集分析很简单的一句代码

ego_up <- enrichGO(Up$ENTREZID, OrgDb = "org.Mm.eg.db", ont="BP", readable=TRUE)#只选择BP富集

富集得到的结果很多，一般见过的柱状图那样显示，可是有很多terms，我们不清楚他们之间的关系，看起来也乱糟糟的。所以需要去除冗余，而clusterProfiler也提供了此功能。

ego_up <- simplify(ego_up, cutoff=0.7, by="p.adjust", select_fun=min)

最后就是可视化了，结果如下

ego_up <- pairwise_termsim(ego_up)
emapplot(ego_up, cex_label_category=.6, cex_line=.5) +  
  scale_colour_continuous(low = "#e06663", high = "#327eba", 
                        name = "p.adjust", 
                        guide = guide_colorbar(reverse = TRUE, order=1), 
                        trans='log10')