.水稻常用数据库
近几年随着测序数据量呈井喷式增长,涌现出一大批优秀的数据库。而水稻和拟南芥分别作为植物研究中单双子叶的模式植物,其基因组信息得到了很大程度的挖掘。下面我结合自己对水稻基因组数据库两年多的使用经验,向大家介绍一下常用的水稻基因组数据库。如有不全之处还望大家多多指正。
我们知道水稻有籼粳之分,粳稻由于其本身抗性较好,遗传转化较为容易等优点,受到了科研人员的青睐,粳稻中的代表性品种当属日本晴。这个网站最初由日本人创立,并且每年都会有更新。你可以在这个网站使用GBrowse查看基因的分布、根据基因号或简称查找基因的功能和序列、使用blast搜索同源基因、使用ID Converter来转换基因号等等。最近他们更新了籼稻「Kasalath」的序列,对基因分化感兴趣的伙伴可以去挖掘一下。
rap-db
RGAP是另一个受人们青睐的粳稻数据库,也是以日本晴作为参考基因组来注释的。最开始由密歇根州立大学牵头(最近他们似乎搬到了Georgia),通过gene ID可以和RAP-db进行基因名的转换,还可以进行go和kegg的搜索。(近几年的水稻基因组高分文章基本上都是采用的它的命名规则,我也不知道为何)
msu
由华中农大牵头,系统整理了4,726份已测序的水稻种质资源,共检测到1700余万个SNP/Indel变异,这些遗传变异可以免费下载(http://ricevarmap.ncpgr.cn/)。文章链接:
Zhao H, Li J, Yang L, Qin G, Xia C, Xu X, Su Y, Liu Y, Ming L, Chen L-L, Xiong L and Xie W.An inferred functional impact map of genetic variants in rice.Molecular Plant.2021, 14: 1584–1599
3010份亚洲稻群体重测序项目是由中国农业科学院作物科学研究所牵头,联合国际水稻研究所、华大基因等16家单位共同完成。该研究对来自89个国家的3,010份水稻品种进行了重测序研究(resequence),参考的是日本晴(Nipponbare)基因组。所有3,010个基因组的平均测序深度(average sequencing depth)为14×,平均基因组覆盖率(average genome coverage)和绘图率(average mapping rate)分别为94.0%和92.5%。
该项目的意义自然不用多说,并且该项目的测序数据都可以在国际水稻所或CNGB上下载。
Data availablehttps://registry.opendata.aws/3kricegenome/
SNP-Seek:http://snp-seek.irri.org
交大版本:https://cgm.sjtu.edu.cn/3kricedb/index.php
农科院作科所:https://rfgb.rmbreeding.cn/index
Rice RC:http://ricerc.sicau.edu.cn/
由四川农业大学牵头,利用nanopore、转录组、Hi-C等技术构建了33个高质量的水稻基因组,并且挖掘出其中的结构变异和拷贝数变异,用来解释作物的驯化、产量等差异,对促进水稻育种和功能基因组学的研究具有重要的意义。
Website:http://mbkbase.org/R498/
主要记录了籼稻R498和粳稻ZH11的基因组信息,但是从2018年开始就没有更新了。
与粳稻相比,籼稻的种植面积更广,遗传多样性也更高。因此国内由华中农大牵头,对优良的籼稻品种珍山97(ZS97)和明恢63(MH63)构建了高质量的参考基因组,提供基因组学,转录组学,蛋白质–蛋白质相互作用(PPIs),代谢网络,代谢物和计算工具等,并且还可以做CRISPR靶点的选择。
水稻不仅籼粳分化严重,并且同一亚种间的分化也很严重,Gramene把人们研究较多的亚种各挑出一个代表来作为指示。Gramene是一个开源的,通过比较功能基因组学整合数据资源的网站。这里面罗列了不同水稻亚种的基因组信息,包括普通野生稻Oryza rufipogon,印度野生稻Oryza nivara,非洲栽培稻Oryza glaberrima等等。里面有一个功能我觉得对做信号传导的朋友有所帮助,称为「Plant Reactome」,它会把报道的基因的信号网络串联起来,形成信号网络,如生长发育信号、次生代谢途径、生物或非生物胁迫等。当然了,这和大牛写的综述是大同小异的,不同的是你可以在网站看到具体的数据,而不仅仅是基因上下游的关系。
网友评论