参考:https://www.bilibili.com/read/cv5465226/
蛋白质组学的输出结果是如下一些ID,如果要做KEGG分析的话,需要将其转换为entrezgene_id,如:57874。
可以使用在线软件:
https://www.uniprot.org/uploadlists/
步骤:
上传ID列表,选择需要转换的ID,submit,download,另存为txt。即可完成。
或者使用biomaRt包
library(biomaRt)
mart <- useMart("ensembl","mmusculus_gene_ensembl")##选择物种:
listFilters(mart)
gene_name<-getBM(attributes=c("uniprotswissprot","external_gene_name","entrezgene_id"),
filters = "uniprotswissprot",
values = rownames(matrix),
mart = mart)
biomaRt包检出的ID要比在线软件少几个,好处是可以一对多转换,而在线工具只能一对一。biomaRt包有时会因为网络原因转换失败。
KEGG分析
library('clusterProfiler')
kegg <- enrichKEGG(gene= gene_name$entrezgene_id,
organism = "mmu", maxGSSize=10000,
keyType = "kegg", pvalueCutoff =1,
use_internal_data = FALSE)#һ??ΪTRUE,???Ը?ΪFALSE
View(as.data.frame(kegg))
dotplot(kegg,showCategory=20,orderBy = "Count")
网友评论