美文网首页
KEGG Orthology 数据库简介

KEGG Orthology 数据库简介

作者: 生信修炼手册 | 来源:发表于2020-02-10 20:06 被阅读0次

    我们经常会使用KEGG数据库来研究基因的功能,而在KEGG 数据库中,直接存储分子功能的就是KEGG Orthology 数据库。

    KEGG Orthology 简称KO,该数据库中的每一条记录用K number 唯一标识。基于同源基因具有相似功能的假设,把基因的功能进行了扩充。对于某个物种中功能研究的很清楚的基因,在不同的物种间搜寻该基因的同源基因,将这些同源基因定义为一个orthology, 用该基因的功能作为该orthology 的功能;这样就将对于不同物种基因功能的研究都利用起来,提供了一个全面的研究基因功能的数据库。

    pathway,module 等数据库都是建立在KO数据库的基础上的,KO可以说是KEGG中处于核心地位的一个数据库,所以理解KO数据库就特别的重要。

    对于一个具体的KO来说,在这个KO下是一系列基因,这些基因可以来源于不同的物种,但是具有相同的功能。以K00161为例,对应的同源基因的列表可以从KEGG的官网查询得到,

    打开这个链接 http://www.genome.jp/kegg/ko.html , 在查询的文本框中输入K number, 如下图所示:

    image

    点击Orthology table按钮,在跳转的页面可以看到具体的基因列表,如下图所示

    image

    在下拉列表中,还可以对物种进行筛选,比如只显示Animals的基因。

    对于已知的基因,可以直接在数据库中检索得到对应的功能,那么对于新发现的基因,如何利用KO数据库来研究其功能呢?

    根据同源基因的定义,序列相似度在80%以上的就定义为同源基因。对于功能未知的基因,我们只需要根据序列比对查找对应的功能已知的同源基因就可以了。

    KEGG官网提供了一个在线的工具,BlastKOALA。这个工具基于blast 比对,将输入的基因序列和KEGG Gene 数据库中的序列去比对,查找最佳匹配的一个gene, 将该基因对应的K number 赋予查询的基因。

    地址如下:http://www.kegg.jp/blastkoala/

    1.首先在文本框中输入带查询的基因的序列

    image

    2.设置对应的物种信息,减少查询的物种范围


    image

    3. 根据实际情况选择用于检索的基因集数据库


    image

    4. 最后输入邮箱地址,提交任务就可以了


    image

    首先会给你的邮箱发一封邮件,你必须点击这个邮件中的链接才能开始工作,当结束后,会再发一封邮件给你,通过邮件中的链接就可以看到最终的分析结果。

    总结

    KO 数据库是研究基因功能的基础数据库,每个KO下对应的是一系列具有相同功能的基因,这些基因可以来源于不同的物种。

    基于序列比对的原理,我们可以利用KO 数据库来研究新基因的功能。

    相关文章

      网友评论

          本文标题:KEGG Orthology 数据库简介

          本文链接:https://www.haomeiwen.com/subject/eozaxhtx.html