对于非模式生物或者无参考基因组的项目,经常需要进行基因的功能注释,而GO注释是基因功能注释的重要部分。有很多软件能够获得GO注释的信息,例如interproscan、eggnog-mapper和blas2go等。
这里主要介绍得到基因对应GO结果后,在R中进行富集分析及可视化过程。
准备文件
1.待富集基因列表
2.背景基因与对应的GO号列表(go2gene)
data:image/s3,"s3://crabby-images/18c7e/18c7ef2c4bd0ed7c4191d2aaef09e3158aea21ea" alt=""
3.所有GO号所对应的term及description(go2name)
data:image/s3,"s3://crabby-images/6e16e/6e16edf49ab692eb5bde58b2e64cbaa7356de889" alt=""
使用
#从GO.db导出所有GO注释信息备用
library(GO.db)
godb <- select(GO.db, keys(GO.db), columns(GO.db))
write.csv(godb, "go2name.csv",row.names=F)
library("clusterProfiler")
# 导入基因列表
gene <- read.csv("geneslist.csv",header=T)
head(gene)
gene <- as.factor(gene$GeneID)
# 导入注释文件
term2gene <- read.csv("go2gene.csv",header=F,sep=",")
term2name <- read.csv("go2name.csv",header = F,sep=",")
# 富集分析
x <- enricher(gene,TERM2GENE=term2gene,TERM2NAME=term2name,pvalueCutoff = 0.05, pAdjustMethod = "BH", qvalueCutoff = 0.05)
# 输出结果
write.csv(x,"GO_enrichment_result.csv",row.names=F)
# 绘制条形图
barplot(x)
# 绘制气泡图
dotplot(x)
data:image/s3,"s3://crabby-images/c70e6/c70e61b82025a58c46ca48fc048c65b268e02d24" alt=""
data:image/s3,"s3://crabby-images/52c1b/52c1bf72f3798ce3821c441e6ffbfdfcf078c646" alt=""
网友评论