美文网首页
生信数据库

生信数据库

作者: 看远方的星 | 来源:发表于2021-03-31 10:20 被阅读0次

一、NR/NT数据库

NR(Non-Redundant Protein Sequence Database)非冗余蛋白库,所有GenBank+EMBL+DDBJ+PDB中的非冗余蛋白序列,对于所有已知的或可能的编码序列,NR记录中都给出了相应的氨基酸序列(通过已知或可能的读码框推断而来)以及专门蛋白数据库中的序列号。NR库相当于一个以核酸序列为基础的交叉索引,将核酸数据和蛋白数据联系起来。NT(Nucleotide Sequence Database),核酸序列数据库,是NR库的子集。

二、COG数据库

蛋白质直系同源簇(Clusters of Orthologous Groups of proteins)
COG数据库是NCBI开发的用于同源蛋白注释的数据库,是将细菌、藻类和真核生物的21个完整基因组的编码蛋白,根据系统进化关系分类构建而成。通过鉴定蛋白与数据库的比对,可以很好的预测蛋白质的功能
COG分为两类,一类是原核生物的,另一类是真核生物。原核生物的一般称为COG数据库;真核生物的一般称为KOG数据库。COG数据库按照功能一共可以分为二十六类。

三、Swiss-Prot数据库

Swiss-Prot蛋白质序列数据库(Swiss-Prot Protein Sequence Database),由欧洲分子生物学实验室主持建立的蛋白质序列数据库。目前已合并入 UniProt数据库。

参考文章

1、速来围观!——三种NCBI常见数据库
2、COG / eggNOG / CAZy / KEGG / CARD数据库简介

相关文章

网友评论

      本文标题:生信数据库

      本文链接:https://www.haomeiwen.com/subject/xndlhltx.html