水稻常用数据库介绍
近几年随着测序数据量呈井喷式增长,涌现出一大批优秀的数据库。而水稻和拟南芥分别作为植物研究中单双子叶的模式植物,其基因组信息得到了很大程度的挖掘。下面我结合自己对水稻基因组数据库两年多的使用经验,向大家介绍一下常用的水稻基因组数据库。如有不全之处还望大家多多指正。
1. RAP-db
[RAP-db]: https://rapdb.dna.affrc.go.jp/
我们知道水稻有籼粳之分,粳稻由于其本身抗性较好,遗传转化较为容易等优点,受到了科研人员的青睐,粳稻中的代表性品种当属日本晴。这个网站最初由日本人创立,并且每年都会有更新。你可以在这个网站使用GBrowse查看基因的分布、根据基因号或简称查找基因的功能和序列、使用blast搜索同源基因、使用ID Converter来转换基因号等等。最近他们更新了籼稻Kasalath的序列,对基因分化感兴趣的伙伴可以去挖掘一下。
rap-db.png2.MSU-RGAP
[MSU-RGAP]: http://rice.uga.edu/index.shtml
RGAP是另一个受人们青睐的粳稻数据库,也是以日本晴作为参考基因组来注释的。最开始由密歇根州立大学牵头(最近他们似乎搬到了Georgia),通过gene ID可以和RAP-db进行基因名的转换,还可以进行go和kegg的搜索。(近几年的水稻基因组高分文章基本上都是采用的它的命名规则,我也不知道为何)
msu.png3. 籼稻注释网站RIGW
[RIGW]: http://rice.hzau.edu.cn/
与粳稻相比,籼稻的种植面积更广,遗传多样性也更高。因此国内由华中农大牵头,对优良的籼稻品种珍山97(ZS97)和明恢63(MH63)构建了高质量的参考基因组,提供基因组学,转录组学,蛋白质 – 蛋白质相互作用(PPIs),代谢网络,代谢物和计算工具等,并且还可以做CRISPR靶点的选择。
4. 整合数据库Gramene
[Gramene]: https://www.gramene.org/
水稻不仅籼粳分化严重,并且同一亚种间的分化也很严重,Gramene把人们研究较多的亚种各挑出一个代表来作为指示。Gramene是一个开源的,通过比较功能基因组学整合数据资源的网站。这里面罗列了不同水稻亚种的基因组信息,包括普通野生稻Oryza rufipogon,印度野生稻Oryza nivara,非洲栽培稻Oryza glaberrima等等。里面有一个功能我觉得对做信号传导的朋友有所帮助,称为Plant Reactome,它会把报道的基因的信号网络串联起来,形成信号网络,如生长发育信号、次生代谢途径、生物或非生物胁迫等。当然了,这和大牛写的综述是大同小异的,不同的是你可以在网站看到具体的数据,而不仅仅是基因上下游的关系。
5. 3K Rice Genome Project
由作科所牵头,对世界范围的3000余份水稻进行了重测序分析,构建了最大的水稻变异信息数据集,对水稻基因组学研究和育种应用提供了丰富的变异资源。
Data available https://registry.opendata.aws/3kricegenome/
SNP-Seek:http://snp-seek.irri.org
交大版本:https://cgm.sjtu.edu.cn/3kricedb/index.php
6. Rice RC
Rice RC:http://ricerc.sicau.edu.cn/
由四川农业大学牵头,利用nanopore、转录组、Hi-C等技术构建了33个高质量的水稻基因组,并且挖掘出其中的结构变异和拷贝数变异,用来解释作物的驯化、产量等差异,对促进水稻育种和功能基因组学的研究具有重要的意义。
7.R498 & ZH11
Website:http://mbkbase.org/R498/
主要记录了籼稻R498和粳稻ZH11的基因组信息,但是从2018年开始就没有更新了。
后记:
其实水稻中还有许多优秀的种质资源的信息,如遗传学大牛Rod wing 发表在NG上的对野生稻的测序;国内韩斌老师和黄学辉老师对水稻pan genome的研究等等。因篇幅有限,下次有机会再单独聊一聊。
参考文献
1.Sakai, H., Lee, SS., et al., Plant & Cell Physiol., 54(2):e6 (2013)
2.Kawahara, Y., de la Bastide, M., Hamilton J. P., Kanamori, H., McCombie, W. R., Ouyang, S., Schwartz, D. C., Tanaka, T., Wu, J., Zhou, S., Childs, K. L., Davidson, R. M., Lin, H., Quesada-Ocampo, L., Vaillancourt, B., Sakai, H., Lee, S. S., Kim, J., Numa, H., Itoh, T., Buell, C. R., Matsumoto, T. 2013. Improvement of the Oryza sativa Nipponbare reference genome using next generation sequence and optical map data. Rice 6:4
3.Song J.-M., Lei Y., Shu C.-C., Ding Y., Xing F., Liu H., Wang J., Xie W.,Zhang J., and Chen L.-L. (2017). Rice Information GateWay (RIGW): A Comprehensive Bioinformatics Platform for Indica Rice Genomes. Mol. Plant.doi: 10.1016/j.molp.2017.10.003.
4.Gramene 2018: unifying comparative genomics and pathway resources for plant research. Tello-Ruiz MK, Naithani S, Stein JC, Gupta P, Campbell M, Olson A, Wei S, Preece J, Geniza MJ, Jiao Y, Lee YK, Wang B, Mulvaney J, Chougule K, Elser J, Al-Bader N, Kumari S, Thomason J, Kumar V, Bolser DM, Naamati G, Tapanari E, Fonseca N, Huerta L, Iqbal H, Keays M, Munoz-Pomer Fuentes A, Tang A, Fabregat A, D'Eustachio P, Weiser J, Stein LD, Petryszak R, Papatheodorou I, Kersey PJ, Lockhart P, Taylor C, Jaiswal P, Ware D. Nucleic Acids Res
5.Wang, W., Mauleon, R., Hu, Z. et al. Genomic variation in 3,010 diverse accessions of Asian cultivated rice. Nature 557, 43–49 (2018). https://doi.org/10.1038/s41586-018-0063-9
6.Qin P, Lu H, Du H, Wang H, Chen W, Chen Z, He Q, Ou S, Zhang H, Li X, Li X, Li Y, Liao Y, Gao Q, Tu B, Yuan H, Ma B, Wang Y, Qian Y, Fan S, Li W, Wang J, He M, Yin J, Li T, Jiang N, Chen X, Liang C, Li S. Pan-genome analysis of 33 genetically diverse rice accessions reveals hidden genomic variations. Cell. 2021 Jun 24;184(13):3542-3558.e16. doi: 10.1016/j.cell.2021.04.046. Epub 2021 May 28. PMID: 34051138.
7.Huilong Du, Ying Yu, Yanfei Ma, Qiang Gao, Yinghao Cao, Zhuo Chen, Bin Ma, Ming Qi, Yan Li, Xianfeng Zhao, Jing Wang, Kunfan Liu, Peng Qin, Xin Yang, Lihuang Zhu, Shigui Li and Chengzhi Liang. Sequencing and de novo assembly of a near complete indica rice genome. Nature Communications
网友评论