美文网首页
R 下载和整理KEGG ORTHOLOGY文件

R 下载和整理KEGG ORTHOLOGY文件

作者: leoxiaobei | 来源:发表于2021-12-21 00:51 被阅读0次

登录KO (KEGG ORTHOLOGY) Database,进入下图页面:

image.png
点击进入KEGG Orthology (KO),进入下图界面:
image.png

右键复制链接,读入R来解析json文件。

library(rjson)
library(jsonlite)
library(tidyverse)
KO <- fromJSON("https://www.kegg.jp/kegg-bin/download_htext?htext=ko00001&format=json&filedir=")#下载并解析JSON文件
KO$name <- NULL
KO <- as.data.frame(KO) %>% 
  unnest(cols = c("children.name","children.children"),names_repair = tidyr_legacy) %>%#重要函数
  unnest(cols = c("children.name","name","children"),names_repair = tidyr_legacy) %>%
  unnest(cols = c("children.name","name","name1","children"),names_repair = tidyr_legacy)
colnames(KO) <- c("L1","L2","L3","KO") 
KO %<>% #整理KEGG ORTHOLOGY
  select(last_col(),everything()) %>%
  separate(col = "KO",sep = "  ",into = c("KO","Description")) %>%
  separate(col = "L1",sep = " ",into = c("L1_ID","L1"),extra = "merge") %>%
  filter(!L1_ID %in% c("09180","09190")) %>% #去除BRITE hierarchies和Not Included in Pathway or Brite两大类
  separate(col = "L2",sep = " ",into = c("L2_ID","L2"),extra = "merge") %>%
  separate(col = "L3",sep = " ",into = c("L3_ID","L3"),extra = "merge") %>%
  separate(col = "L3",sep = " \\[PATH:",into = c("L3","PathwayID")) %>%
  mutate(PathwayID=str_remove(PathwayID,pattern = "\\]")) %>%
  drop_na()#KEGG ORTHOLOGY等级有缺失的删掉
head(KO)
# A tibble: 6 x 9
# KO     Description                                                L1_ID L1         L2_ID L2                      L3_ID L3                     PathwayID
# <chr>  <chr>                                                      <chr> <chr>      <chr> <chr>                   <chr> <chr>                  <chr>    
# 1 K00844 HK; hexokinase [EC:2.7.1.1]                                09100 Metabolism 09101 Carbohydrate metabolism 00010 Glycolysis / Gluconeo~ ko00010  
# 2 K12407 GCK; glucokinase [EC:2.7.1.2]                              09100 Metabolism 09101 Carbohydrate metabolism 00010 Glycolysis / Gluconeo~ ko00010  
# 3 K00845 glk; glucokinase [EC:2.7.1.2]                              09100 Metabolism 09101 Carbohydrate metabolism 00010 Glycolysis / Gluconeo~ ko00010  
# 4 K25026 glk; glucokinase [EC:2.7.1.2]                              09100 Metabolism 09101 Carbohydrate metabolism 00010 Glycolysis / Gluconeo~ ko00010  
# 5 K01810 GPI, pgi; glucose-6-phosphate isomerase [EC:5.3.1.9]       09100 Metabolism 09101 Carbohydrate metabolism 00010 Glycolysis / Gluconeo~ ko00010  
# 6 K06859 pgi1; glucose-6-phosphate isomerase, archaeal [EC:5.3.1.9] 09100 Metabolism 09101 Carbohydrate metabolism 00010 Glycolysis / Gluconeo~ ko00010  

相关文章

  • R 下载和整理KEGG ORTHOLOGY文件

    登录KO (KEGG ORTHOLOGY) Database[https://www.kegg.jp/kegg/k...

  • 氮循环对应KO号

    https://www.genome.jp/kegg/ko.html KEGG Orthology 简称KO, 对...

  • R 针对KEGG ORTHOLOGY的Lefse分析

    在拿到PICRUST2预测的KO丰度表格后,我们其实接下来也可以像完成优势物种进化分支图一样来针对KO的Lefse...

  • KEGG Network 数据库

    kegg orthology 数据库是 kegg 的核心,利用基因在不同物种之间的保守性,使得我们可以在更高层次上...

  • 2021-08-13 可视化kegg通路-pathview包本地

    Pathview是一个可视化KEGG通路的R包,它会在线从KEGG网站上下载KEGG通路,并进行个性化处理,例如填...

  • KEGG Module 数据库

    具有相同功能的基因被归类到kegg orthology 中,每个KO 代表具体的一个功能。在生命活动中,往往需要多...

  • KEGG Orthology 数据库简介

    我们经常会使用KEGG数据库来研究基因的功能,而在KEGG 数据库中,直接存储分子功能的就是KEGG Orthol...

  • KEGG pathway 注释整理

    KEGG pathway 注释整理 获得KEGG注释 通过eggnog-mapper和interproscan两个...

  • 水稻KEGG 背景文件下载

    进入如下网址 选择目标物种,这里以水稻为例子,点击 dosa 点击download htext即可完成下载

  • 生信习题 | 一

    以下是分析和学习过程中遇到的值得记录一下的生信习题库 题目1:下载最新版的KEGG注释文本文件,编写脚本整理成ke...

网友评论

      本文标题:R 下载和整理KEGG ORTHOLOGY文件

      本文链接:https://www.haomeiwen.com/subject/jgzzfrtx.html