探序基因计算机工作室整理
1. 能实现基因富集功能的网站
参考:简书-Metascape 专门为生物学者设计的基因富集分析网站
2. 安装R包
KEGG富集的时候转换基因标志要用到:org.Mm.eg.db、org.Hs.eg.db
BiocManager::install("clusterProfiler",ask=F,update=F)
BiocManager::install("org.Mm.eg.db",ask=F,update=F)
BiocManager::install("org.Hs.eg.db",ask=F,update=F)
如果用BiocManager::install方法安装比较慢的话,可以去bioconductor.org下载org.Hs.eg.db包源代码及相关依赖的包的代码,在服务器上用R CMD INSTALL xxx来安装。
3. 使用
案例1,给定基因做GO富集分析
library(org.Hs.eg.db)
library(clusterProfiler)
#基因存到一个向量中,然后转换成数字ID的形式
#idlist2为:"3604" "9452" "2115" "1493" "939" "3902" "56253"
id_list <- c("TNFRSF9","ITM2A","ETV1","CTLA4","CD27","LAG3","CRTAM")
idlist2 <- as.character(mapIds(org.Hs.eg.db,id_list,"ENTREZID","SYMBOL"))
go <- enrichGO(gene = idlist2, # Entrez ID列表
OrgDb = org.Hs.eg.db, # 指定物种数据库
keyType = "ENTREZID", # 指定给定的名称类型
ont = "ALL", # 可选,BP(生物学过程)/CC(细胞组分)/MF(分子功能)/ALL(同时指定)
pAdjustMethod = "BH", # P值校正方法,还可以是fdr
pvalueCutoff = 0.05,qvalueCutoff = 0.2, # p/q值阈值
readable = T # 将ID转换为symbol
)
#转换成数据框的形式,方便查看结果
go.res <- data.frame(go)
做KEGG富集分析
keggtab <- enrichKEGG(
gene = idlist2, #基因列表文件中的基因名称
keyType = 'kegg', #KEGG 富集
organism = 'hsa', #例如,oas 代表绵羊,其它物种更改这行即可
pAdjustMethod = 'fdr', #指定 p 值校正方法
pvalueCutoff = 0.05, #指定 p 值阈值(可指定 1 以输出全部)
qvalueCutoff = 0.2) #指定 q 值阈值(可指定 1 以输出全部)
organism 参数中的物种名称列表在:https://www.genome.jp/kegg/catalog/org_list.html
但是作者在运行时,遇到错误:
Reading KEGG annotation online:
fail to download KEGG data...
Error in download.KEGG.Path(species) :
'species' should be one of organisms listed in 'http://www.genome.jp/kegg/catalog/org_list.html'...
此外: Warning message:
In utils::download.file(url, quiet = quiet, method = "libcurl", :
URL 'https://rest.kegg.jp/link/hsa/pathway': status was 'Failure when receiving data from the peer'
------------------------------------------------------
简书-R包 clusterProfiler 比较不同dataset富集结果
4. 富集结果绘图
待补充
网友评论