SEED数据库简介及使用

作者: Pandeng_Wang | 来源:发表于2020-08-23 17:05 被阅读0次

    SEED是什么

    SEEDFellowship for Interpretation of Genomes (FIG)在2003年发起的一项无资金支持的的开源项目。该项目的核心目的是开发一种更准确、更大规模的基因组注释技术,并利用该技术对前1000个测序基因组提供更好的注释。该项目是建立在这样一个原则之上的:提高高通量注释技术准确性的关键是让专家注释整个基因组集合上的单个Subsystem,而不是让注释专家试图注释单个基因组中的所有基因。Subsystems技术是SEED项目成员为了对上千个基因组提供统一而准确的注释所提出和开发的。

    A subsystem is a set of functional roles that an annotator has decided should be thought of as related. Frequently, subsystems represent the collection of functional roles that make up a metabolic pathway, a complex (e.g., the ribosome), or a class of proteins (e.g., two-component signal-transduction proteins within Staphylococcus aureus).

    使用Subsystems方法,Subsystem中的所有基因由将由该Subsystem的专家进行分析校正,从而保证注释的准确性。subsystems发展的详细过程见https://theseed.org/wiki/Annotating_1000_genomes
    现在,SEED是一个不断更新的分析环境和基因组数据的集合,包括基因组数据、subsystems、FIGfams (蛋白家族)、网页前台、API和分析脚本等。已被很多科学家用以预测基因功能和发现新的代谢路径。

    SEED使用

    SEED-Viewer

    Subsystem Overview
    目前(2020.08)SEED一共有1358个完整的Subsystems。在此网站上能够查看不同Subsystem的具体内容。
    image.png

    RAST Annotation Server
    RAST (Rapid Annotation using Subsystem Technology) 是一个用于注释完整或几乎完整的细菌和古细菌基因组的全自动流程。能为位于系统发育树中不同位置的基因组提供高质量的基因组注释。
    FIGfams(蛋白家族数据集),是RAST对新的基因组进行快速注释的核心。FIGfams的创建和使用方式如下图所示:

    FIGfams的创建和使用方式

    RAST提供基因组在线注释服务,简单使用流程如下:

    1. 注册账号


    2. 登录之后上传自己的基因组序列(fasta文件)


    3. 填写基因组的物种信息


    4. 参数选择



      这一步可以选择构建代谢模型(Build metabolic model),可用以后续分析。

    5. 完成上传,等待结果


    6. 查看subsystem注释结果



    7. 查看代谢模型




      这一步会跳转到ModelSEED的网站,在这个网站上可以查看自己的基因组中注释到的各种反应、代谢物、基因和代谢通路等。还能基于构建的代谢模型,进行FBA分析和Gap filling。

    更多RAST的使用教程,可以访问https://rast.nmpdr.org/

    ModelSEED
    ModelSEED一直是基于微生物或植物基因组的注释信息构建基因组尺度代谢模型的重要资源。ModelSEED现在包括33978种化合物和36645种反应,可在https://modelseed.org和KBase上进行搜索查看。

    除了通过RAST网站构建基因组尺度的代谢模型外,在ModelSEED网站,也可以通过上传基因组序列进行代谢模型的构建和分析。

    Metagenomics RAST Server
    使用跟RAST相同的技术,SEED还提供了宏基因组的分析注释服务。


    具体分析流程如下:

    参考资料
    https://theseed.org/wiki/Home_of_the_SEED

    Overbeek R, Begley T, Butler RM, et al. The subsystems approach to genome annotation and its use in the project to annotate 1000 genomes. Nucleic Acids Research. 2005;33:5691–5702.

    Meyer Folker, Overbeek Ross, Rodriguez Alex. FIGfams: yet another set of protein families. Nucleic Acids Research. 2009;37(20):6643–6654.

    Aziz RK, Bartels D, Best AA, et al. The RAST server: rapid annotations using subsystems technology. BMC Genomics. 2008;9:75.

    https://github.com/ModelSEED/ModelSEEDDatabase

    Meyer, F., Paarmann, D., D'Souza, M. et al. The metagenomics RAST server – a public resource for the automatic phylogenetic and functional analysis of metagenomes. BMC Bioinformatics 2008;9:386.

    相关文章

      网友评论

        本文标题:SEED数据库简介及使用

        本文链接:https://www.haomeiwen.com/subject/dnavjktx.html