在日常分析中,我们在NCBI数据中常常见到AC、NC、NM、NR、NP、NG等各类编号,这类编号分别代表着怎样的含义?我们该如何根据自己的需求来选择正确的编号呢?
今天就来说一说常见的NCBI编号的意义。
1)AC_***:genomic mixed,一些可供选择的注释的基因组序列,主要用来标记病毒和原核生物;
2)AP_***:protein mixed,AC_标记序列对应的蛋白产物;
3)NC_***:genomic mixed,完整的基因组分子序列,标记的类别包括基因组、染色体、细胞器、质粒;
4)NG_***:genomic mixed,不完整的基因组区域,提供NCBI基因组注释途径。比较有代表性有不转录的假基因或者哪些很难自行化注释的基因组簇;
5)NM_***:mRNA mixed,转录组产物序列;成熟mRNA转录本序列;
6)NP_***:protein mixed,蛋白产物;主要是全长转录氨基酸序列,但也有一些只有部分蛋白质的部分氨基酸序列;
7)NR_***:RNA mixed,非编码的转录子序列,包括结构RNAs,假基因转子等;
8)NT_***:genomic automated,BAC或者鸟枪测序法的还未完全注释的测序序列;
9)NW_***:genomic automated,BAC或者鸟枪法测序的还未完全注释的测序序列;
10)NZ_ABCD1234***:genomic automated,收集的各种利用鸟枪法测序的测序计划,ABCD代表的是计划名称;
11)XM_***:mRNA automated,转录产物;mRNA来自基因组注释,序列相当于基因组重叠群;
12)XP_***:protein automated,蛋白产物;序列相当于基因组重叠群;
13)XR:RNA automated,转录产物;非编码区来自基因组注释,序列相当于基因组重叠群;
14)YP_***:protein mixed,蛋白产物;不涉及到转录组,主要用来标记细菌、病毒和线粒体;
15)ZP_***:protein automated,蛋白产物;主要是用电脑自动注释;
16)NS_***:genomic automated,未知生物分子基因组序列。
网友评论