KEGG数据库

作者: 丿年梦 | 来源:发表于2020-08-22 16:09 被阅读0次

    一些关于KEGG数据库的信息

    整理时间:20200822

    写在前面

           KEGG数据库是作者接触较早的一个数据库,主要是用来调研一些特定物质代谢途径以及相关基因信息。当前刚好有机会写一篇对KEGG数据可的介绍,希望可以把自己在调研和使用过程中对KEGG的认识和经验分享给大家,KEGG数据库功能比较多,目前仅整理了作者使用较多的功能进行介绍,如果需要补充或者是不对的地方,请各位读者批评指正。

    KEGG数据库简介

             官方的简介:KEGG is a database resource for understanding high-level functions and utilities of the biological system, such as the cell, the organism and the ecosystem, from molecular-level information, especially large-scale molecular datasets generated by genome sequencing and other high-throughput experimental technologies. 

             个人理解:在作者印象中。KEGG是一个非常全面的代谢途径信息数据集。数据集中的代谢通路根据功能不同被归来到不同的模块,比如糖酵解途径、TCA循环途径等。为方便统计,该数据库提供了统一的途径命名和level划分,是宏组学数据以及代谢途径重构过程中非常重要的数据集,愿称之为生信神器。官网链接为KEGG: Kyoto Encyclopedia of Genes and Genomes

             另外,作者发现该数据库是一直在更新和维护的哦,可以放心使用,更新时间和内容见链接KEGG Release Notes,最近一次更新是2020-08-01。截至2020-08-22,KEGG数据库中的数据统计如下,包括了723,,580条代谢途径,6,710个微生物基因组以及341个病毒基因组。

    KEGG数据库数据库的使用

          作者在日常学习和工作中主要是重构一些微生物代谢产物的代谢途径,使用KEGG的网页工具即可实现。网络上也有较多的教程可供参考,为了节约大家时间和效率,此处直接上链接(其他作者已经整理的比较详细了)

    一文快速读懂 KEGG 数据库与通路图 - 知乎 (作者:白墨)

    KEGG在线数据库使用攻略_刘永鑫的博客——宏基因组公众号-CSDN博客_kegg mapper search result 的brite什么意思(作者:刘永鑫)

          以上两个链接里已经对KEGG的网页简介以及使用方法进行了详细的说明,感兴趣的小伙伴可以转过去。特别推荐KEGG的一些在线分析工具,尤其是BlastKOALABlastKOALA - Query Data InputGhostKOALAGhostKOALA - Query Data Input,可对组学数据集进行注释,GhostKOALA与BlastKOALA使用方法相同,步骤可以参考刘永鑫师兄的博客,有图片和文字说明,官网也提供了详细的使用说明GhostKOALA - Step-by-step Instructions。使用过程中需要小伙伴们自己准备好组装或者ORF序列,格式为FASTA文件(特别注意:序列文件上传时只接受氨基酸序列,并且不能存在重复序列,单次上传量300Mb,如果数据量较多的小伙伴只能使用本地化工具喽)。

    简要的过程见下图

    1.输入序列文件

    2.选择序列对应的物种类型

    3.选择合适的数据库

    4.输入个人邮箱并发送请求(系统往提供的邮箱中发送确认文件,另外,序列较大时该网页需要上传,请耐心等待)



    KEGG数据库本地化

           之前只能使用GhostKOALA进行在线功能注释,今年KEGG数据库团队非常给力,推出了最新的、可本地化的注释工具:KofamKOALA 。该工具于今年在Bioinformatics杂志发布,文献链接KofamKOALA: KEGG Ortholog assignment based on profile HMM and adaptive score threshold | Bioinformatics | Oxford Academic,当然也提供了在线的工具,工具链接KofamKOALA。本地化教程刘永鑫师兄也撰写了博客,可跳转学习KEGG功能注释工具 KofamKOALA 安装与使用_刘永鑫的博客——宏基因组公众号-CSDN博客_kofamkoala

    相关文章

      网友评论

        本文标题:KEGG数据库

        本文链接:https://www.haomeiwen.com/subject/pfevjktx.html