Mouse Genome Informatics(MGI)
网址:
http://www.informatics.jax.org/
介绍:
MGI is the international database resource for the laboratory mouse, providing integrated genetic, genomic, and biological data to facilitate the study of human health and disease.
MGI是实验室小鼠的国际数据库资源,提供综合的遗传、基因组和生物学数据,以促进人类健康和疾病的研究。
MGI可以获得什么信息
1 基因在ENSEMBL, Havana/Vega, MGI,NCBI的可视化比较
下图是某个基因区域在几大数据库的可视化结果。可以很直接的比较小鼠和人类基因组的区别。
感兴趣的直达链接:http://www.informatics.jax.org/genes.shtml
2 某个基因或者突变在小鼠身上发生的变异
这个数据库很全,几乎所有的基因都能搜到。
动手搜一搜就能找到你研究的基因在小鼠敲除模型中会发生什么变化。
以Sox2为例,在小鼠突变模型中与“行为,听力/前庭/耳朵,皮肤,死亡率/衰老,神经系统,色素沉着”有关。
感兴趣的直达:http://www.informatics.jax.org/phenotypes.shtml
3 人类-小鼠相关的疾病
这个是结合了人类和小鼠疾病的信息,作为一个识别人类疾病候选基因,并以此作为小鼠模型的有力工具。
网站直达:http://www.informatics.jax.org/humanDisease.shtml
4 基因表达数据库
小鼠基因表达数据库整合了多个数据库的信息。亮点是展示了内源基因在小鼠发育过程中的表达变化。
网站直达:http://www.informatics.jax.org/expression.shtml
5 其他
除了上面的信息,还能查找以下信息。
Recombinase (cre) Activity:http://www.informatics.jax.org/home/recombinase
使用Gene Ontology (GO) 进行功能注释:http://www.informatics.jax.org/function.shtml
Strains and SNPs:http://www.informatics.jax.org/home/strain
脊椎动物同源:http://www.informatics.jax.org/homology.shtml
小鼠肿瘤数据库:http://tumor.informatics.jax.org/mtbwi/index.do
应用
下文以转录组研究得到的差异表达基因NR4A1为例,浅析如何进一步研究一个陌生的基因。
MGI数据库的界面简单易用,输入基因的名称并回车,就可实现快速检索。
如下图所示,我们可以查到NR4A1这个基因或基因产物的全名与其他名称、其染色体定位(Location &Maps),以及其他物种中的同源基因。以NR4A1为例,其在人类的同源基因也称为NR4A1,同时,数据库中还有8种其他脊椎动物的NR4A1同源基因的信息(Homology)。在“Human diseases”一栏,我们可知该基因的突变与一种人类疾病相关,记载该突变的文献2篇。
在"Mutations,alleles,and Phenotypes"一栏,可以看到有86篇文献记录了NR4A1基因突变表现出的不同表型,引入突变的手段包括随机插入突变、化合物诱导等。突变影响的器官系统在下图中为标蓝的类别,即心血管系统、造血系统、免疫系统等。
数据库中也给出了基因本体(Gene Ontology,GO)分析的结果,不过,转录组分析的结果也通常会进行GO分析。
MGI数据库中还有一项较为有用的信息则是NR4A1基因表达于哪些组织(下图中标蓝的组织)。如果做转录组研究时所提供的样本并非下列表达NR4A1的组织,但又检测到NR4A1基因存在差异表达,则有必要验证转录组结果的可信性。
其他信息还包括:NR4A1的多态性位点、NR4A1蛋白包含的蛋白质结构域等。“References”一栏包括了涉及NR4A1基因的所有文献,与Pubmed的检索不同,MGI中的文献包括了同一基因不同名称的文献检索结果,如NR4A1也称Gfrp、GFRP1、Hbr1、Hbr-1、Hmr、N10、NGFI-B、NP10、Nur77、TIS1、TR3。
NR4A1多态性位点如下图所示。
点开MGI提供的蛋白质结构域信息的链接,可以查出该结构域可能与哪些蛋白或结构域相互作用,并非特定蛋白与蛋白的相互作用信息。
如果需要查找特定蛋白相互作用的信息,Jackson Lab的网站上也提供了数据库,MouseLine的一项Protein-Protein Interactions功能,网址:
http://www.mouseline.org/mouseline/template.do?name=Gene_Interactions&scope=global
结果如下图所示,给出了从前的研究者免疫共沉淀的结果,证明了NR4A1可与下列蛋白或直接或间接形成复合物。
类似的查看蛋白质相互作用信息的网站还有Unified Human Interactome(http://www.unihi.org/)以及STRING(http://stringdb.org/cgi/input.pl),这两个网站的结果优于Mouseline的地方是直观的相互作用可视图。
研究一个基因时,必不可少的是该基因参与的信号通路,以及上下游的调控基因。如何查找NR4A1参与的信号通路在MGI中并没有很简便易用的工具,建议使用KEGG在线检索,网址 https://www.kegg.jp/kegg/kegg3a.html
搜索NR4A1后出现如下通路,可点击通路代码查看具体通路图。
ko04010了解基因表达的组织,初步了解基因的不同组织内的潜在功能,建立好大致的通路框架,相互作用的蛋白质,可以自己初步勾勒出某一相对陌生的基因的功能与调控通路,后续则是常规的“套路”,对该基因或者上下游的相关基因knockdown,knockout,conditional knockout,tissue specific knockout,overexpression,inhibitor treatment,agonist treatment……
-------------------------------------------------------------------------------------------------------------------------------------------------------------I'm a line ! Thanks for your attention !----------------------------------------------------------------------------------------------------------------
参考:
https://www.cnblogs.com/chenwenyan/p/11938268.html
https://kuaibao.qq.com/s/20180716G1UMFJ00?refer=cp_1026
网友评论