美文网首页
生物数据库之专项数据库

生物数据库之专项数据库

作者: yhh_hygge | 来源:发表于2020-04-24 21:34 被阅读0次

一、京都基因与基因组百科全书KEGG

KEGG,全称京都基因与基因组百科全书(http://www.genome.jp/kegg)。它是关于基因、 蛋白质、生化反应以及通路的综合生物信息数据库。

由多个子库构成( 图 1. KEGG 子库列表 )。

image-20200425145016396

以上都是 KEGG 的子数据库,可以说包罗万象,不愧是百科全书。这些子库中,KEGG PATHWAY 数据库包含了大量物种的代谢与生物信号传导通路信息。

Pathway 数据库下又分 为 7 个部分:

1)Metabolism,

  • 其中 Metabolism 代谢通路这部分,又具体分为几个专题:

    • 1)Global/overview,

    • 2)Carbohydrate,

    • 3)Energy,

    • 4)Lipid,

    • 5)Nucleotide,

    • 6)Amino acid,

    • 7)Other amino,

    • 8)Glycan,

    • 9)Cofactor/vitamin,

    • 10)Terpenoid/PK,

    • 11)Other secondary metabolite,

    • 12)Xenobiotics,

    • 13)Chemical structure。

2)Genetic Information Processing,

3)Environmental Information Processing,

4)Cellular Processes,

5)Organismal Systems,

6)Human Diseases,

7)Drug Development。

我们选择 Global/overview 总图这个专题点击查看。这时就会出现一张线路板一样的图 (图 2)。

image-20200425145723051

图中有一个圆圈。我们把显示比例调成 100%。放大这个圆圈看一下(图 3)。

image-20200425145412982

我们看到这个圈的名字是 TCA 循环,也就是三羧酸循环。这个图上的每一个圆点儿代表一个化合物,把鼠标放在某一个点上,会出现化合物的分子式,点击可进入相应数据库查看详细。 图上的每一条线代表一个生化反应。把鼠标放到三羧酸循环的名字上,可以看到一个更加详细的通路图,我们点击这个名字。得到三羧酸循环详细的通路图(图 4)。

image-20200425145947998

其中圆圈是化合物,箭头代表反应及反映方向。方块中的是酶。虚箭头指向其他途径,中间过程省略没有列 出。当点击某一个酶的时候会直接进入 KO 数据库。KO 是 KEGG 中的一个“专有名词”, 表示蛋白质或者说酶的一个分类体系。序列高度相似,并且在同一条通路上有相似功能的蛋 白质被归为一组,然后打上一个 KO 标签。从对应的 KO 数据库记录中可以查看当前这个酶的定义,酶学命名,参与途径,功能,结构等信息。KO 数据库记录的下面是这个酶在 KEGG 酶库里的信息。以及该酶所参与的化学反应在反应库里的信息。

接下来我们看一下 Toll 样受体的信号传导通路。它位于 KEGG Pathway 数据库里的 Organismal Systems 部分的 Immune system 专题里。图 4 是人的各种 Toll 样受体信号传导通路 图。可以看到在细胞膜和内质网上,有很多种 Toll 样受体。它们识别了不同的入侵物后, 激活下游蛋白,一个接一个的传递信号,直至产生各种细胞因子,激发炎性反应。如果点击其中的 Toll 样受体 4,可以看到这个蛋白质的详细信息,包括它参与的各种 Pathway。此外, 还有该蛋白可引发的疾病信息,并且可以链接到 KEGG 人类疾病数据库。此外,数据库记 录里还提供了两个相关的 Drug,其中一个 Drug 叫 Eritoran(图 5)。

image-20200425150102038

它是 Toll 样受体 4 的拮 抗剂。因为它长得和 Toll 样受体 4 的激动剂 LPS 脂多糖很像,所以可以被 Toll 样受体 4 捕 获。但是因为它又比激动剂 LPS 少了两条链,所以 Toll 样受体 4 捕获它之后不能激活下游 的信号传导,从而使 Toll 样受体 4 丧失免疫功能。这种药可以用于 Toll 样受体 4 引发的自 身免疫疾病的治疗。

二、人类孟德尔遗传在线 OMIM

最后我们来看一个有关人类遗传病的数据库,人类孟德尔遗传。它是一个将遗传病分类,并链接到相关人类基因组中的数据库。它的在线版本是人类孟德尔遗传在线 OMIM。OMIM 为临床医生和科研人员提供了权威可信的关于遗传疾病及相关疾病基因位点的详细信息。

NCBI 的 OMIM 子库页面点击 Getting Started 进入数据库, 或者直接从 OMIM 主页进入。

以阿尔茨海默症(AD)为例,在搜索条中输入:alzheimer disease。搜索结果里排在第 一位的就是我们想要的。点击进入后数据库给出了与 AD 相关的致病基因。

image-20200425213034396

包括他 们在染色体中的位置,所引发表型的数据库编号,以及基因的数据库编号等。

此外,页面上 还提供大量的文字信息。如果我们点击某一个染色体定位的话。会出现这个位置附近基因的 列表,以及引发的各种疾病。点击某一基因的数据库编号,可以查看这个基因的详细信息。

相关文章

  • 认识核酸数据库

    今天了解几个重要的生物数据库~生物数据库种类很多,可以分为 核酸数据库、蛋白质数据库,和一些特殊的专用数据库。而数...

  • Leetcode数据库专项训练

    Leetcode数据库专项训练 最近学完了数据库,发现数据库不是单单我以前的增删改查那么简单,也需要考虑很多方面,...

  • 【读书笔记】生信札记 第二章

    1.简介 生物信息学涉及的数据库可大致分为二种:初级数据库和二级数据库。 初级数据库贮存原始的生物数据,如 DNA...

  • 10月数据库汇总

    截止9.21-10.21之间总共 发表了在线医学相关数据库49个。由于微生物和病毒方面的数据库比较多。所以相较于之...

  • 常用生物学数据库

    生物学数据库 Biology Databases --------------------------------...

  • 生物信息学相关数据库

    生物信息学数据库可以分为4大类:即基因组数据库、核酸和蛋白质一级结构数据库、生物大分子三维空间结构数据库,当前研究...

  • 你的数据也可以-两篇NAR的数据库

    生物信息分析离不开数据资源和数据库,生物信息学数据库分类概览 (第一版)系统梳理了常用功能数据库。 下面再分析2个...

  • 在线作图|FAPROTAX数据库在线注释

    FAPROTAX数据库 在微生物多样性分析中,FAPROTAX数据库是常用的群落功能注释数据库。FAPROTAX数...

  • 【生信课程】02生物数据库-山东大学-生物信息学

    生物数据库 一级核酸数据库 NCBI https://www.ncbi.nlm.nih.gov/ EBI DDB...

  • 生物数据库

    生物数据库 基本序列格式 1.FASTA格式:首行为描述行,以>为起始,其后为描述信息;第二行即为原始序列。2.F...

网友评论

      本文标题:生物数据库之专项数据库

      本文链接:https://www.haomeiwen.com/subject/mqelwhtx.html