NCBI (National Center for Biotechnology Information)`是指美国国立生物技术信息中心
第一步进入NCBI 进行搜索:https://www.ncbi.nlm.nih.gov/gene/672
imageOfficial Full Name 和 See related 列出的都是BRCA1的其他名字,最常用的就是Official Full Name ,后面的“DNA repair associated”说明该基因和DNA的修复有关.
HGNC 全称为HUGO Gene Nomenclature Committee,叫做 HUGO基因命名委员会。并且不是所有的基因都有official symbol的,如果缺少HGNC提供的symbol,那么就在Entrez ID前加上LOC前缀,比如LOC109761693
,前面的标题也变成了Gene Symbol
因此,NCBI的基因都具有Entrez ID和symbol,但是不一定有官方的HGNC symbol
Organism 物种的来源, Homo sapiens 表示人类
最上方的 Gene ID
:672, 表示这个基因在NCBI Entrez gene 数据库中的代号
什么是Entrez?
Entrez是一个综合性在线资源检索器,包含核酸、蛋白质、基因、基因组、GEO、pubMed等很多常用的数据库,把序列和相关文献都汇集到一起,用起来就像谷歌百度一样包罗万象。相信你不少听到别人说去NCBI 查一下,其实准确来说是去Entrez查一下,因为NCBI只是一个组织,Entrez才是干活的。
什么是Entrez ID?
NCBI的Gene数据库包含了不同物种的基因信息,其中每一个基因都被编制一个唯一的识别号ID(因此不同生物或者同属不同种的生物间的同源基因编号也不相同), 这个ID就叫做Entrez ID,就是基因身份证啦。它对应于染色体上一个gene location。
image
如何检索Entrez?
选择Gene数据库,然后输入基因名(symbol)或者编号(ID),比如上面检索BRCA1的过程就是这样
进入官网:https://www.ncbi.nlm.nih.gov/geo/
image选择Gene数据库,输入待查询的 Symbol 或者 Gene ID.
image
See related 相关的其他数据库名称:
-
Ensembl:ENSG00000012048
很明显是Ensembl数据库中的ID号。Emsembl是英国Snager研究所和欧洲分子生物学实验室(EMBI-EBI)共同运作的一个数据库,目的是对真核生物的基因组进行自动化的注释,其中脊椎动物最多,包括爬行类、鸟类、鱼类、哺乳类和两栖类。命名规则:
ENSxxxG/T/E
,xxx
表示物种(除了人类不需要)。其中ENS表示Ensembl,最后的G表示基因ID;T表示转录本ID;E表示外显子ID。需要注意的是有的基因名称后面有小数点,后面的数字代表版本,实际分析的时候需要去掉
-
MIM:113705
这个是OMIM数据库中的代号,OMIM是0nline Mendelian Inheritance in Man
即在线版的人类孟德尔遗传,提供人类基因和遗传紊乱的数据,专注于遗传病。其中会对这个基因进行详细的描述,并且有相关的参考文献作指导 -
Vega:OTTHUMG00000157426
来自Vega数据库Vertebrate Genome Annotation
即脊椎动物基因组注释
大部分基因都有自己的5种类型ID,特定的基因如miRNA在miRBase中有自己的ID;LncRNA虽然没有标准的命名,但是相关的数据库IncRNAdb、LNCipedia都有自己的一套命名方式
5种类型:NCBI的entrez ID及gene symbol,Ensembl的gene ID,UCSC的gene ID,KEGG的gene ID,大部分的ID都可以在HGNC
中查找
前三种上面👆有所了解了,那么UCSC的ID以uc
开头,BRCA1对应的就是uc002ict.4
;
KEGG的gene数据库的命名方式是:三个小写字母表示物种,后面再加ID号,例如BRCA1对应hsa:672
网友评论