美文网首页js css html
代谢通路的获取

代谢通路的获取

作者: 可能性之兽 | 来源:发表于2023-03-25 23:00 被阅读0次

KEGG(Kyoto Encyclopedia of Genes and Genomes)是一个生物信息学数据库,它包含了关于基因、蛋白质、代谢物及其在代谢通路中的信息。keggGet()是KEGGREST R软件包提供的一个函数,用于从KEGG数据库中获取特定KEGG标识符的条目。在使用keggGet()时,需要注意服务器限制,即每次只能返回10个结果集[2][3]。

要获取KEGG数据库中的代谢通路,可以使用KEGGREST R软件包提供的函数。首先,需要安装KEGGREST软件包[5]。使用listDatabases()函数可以查看可以利用的数据库。可以使用keggList("pathway")获取KEGG数据库中所有的代谢通路列表。然后,可以使用keggGet函数来获取特定代谢通路的条目,例如keggGet("path:map00010")可以获取“Glycolysis / Gluconeogenesis”代谢通路的条目。如果想要获取所有代谢通路,可以先获取代谢通路列表,然后循环获取每个代谢通路的条目[4][10]。

需要注意的是,在进行KEGG富集分析时,需要制作富集背景文件,该文件包含所有代谢通路中包含的所有基因(蛋白质)或代谢物[1]。

https://zhuanlan.zhihu.com/p/537069715

hsa_path <- keggLink("pathway","hsa") 
#得到字符型向量。元素名为基因id,元素为通路名
# 因为是在线获取,所以根据网络情况,耗时4-10分钟不等
#查看hsa_path的前6个
length(hsa_path)
hsa_path[1:6] 
length(unique(names(hsa_path)))
length(unique(hsa_path))


meta= unique(hsa_path)[grepl('hsa00',unique(hsa_path))]
hsa_info <- lapply(meta, keggGet)  

nm=unlist(lapply( hsa_info , function(x) x[[1]]$NAME))
library(stringr)
genes = unlist(lapply( hsa_info , function(x) {
  g = x[[1]]$GENE
  paste(str_split(g[seq(2,length(g),by=2)],';',simplify = T)[,1],collapse =';')
}))
df =data.frame(
  hsa= meta,
  nm=nm,
  genes =genes
)

相关文章

网友评论

    本文标题:代谢通路的获取

    本文链接:https://www.haomeiwen.com/subject/eetordtx.html