国家基因库生命大数据平台(CNGBdb)是一个为科研社区提供生物大数据共享和应用服务的统一平台。本质是我国组建的一个类似于NCBI存储分子数据的数据库。前身是深圳华大生命科学研究院(原深圳华大基因研究院)的深圳国家基因库。2018年10月在深圳召开第十三届国际基因组学大会(“ICG-13”),开幕式上深圳国家基因库正式发布了“国家基因库生命大数据平台(CNGBdb)”。
该数据库为面向世界的开放平台,但拥有全中文界面(可以设置为英文),对初学者较为友好。
网站资源平台资源包括文献、基因、变异等十类。目前样本库与组装库较为好用。在这两个库中可以将上传至本库与NCBI的数据过滤开,而在基因、序列等库中,基本是接入NCBI或INSDC,若有直接上传的也没有过滤的通道,这就导致若用户上传raw数据至实验库,或分子标记至序列库就将与NCBI的数据混淆起来。解决方法是在样本库中输入感兴趣的研究对象(Organism),能找到相关研究的项目编号、样本编号、实验编号、测序信息、原始数据(fastq文件)及对应的超链接,组装库中可以搜索到注释了的全基因组。这样基本能获取CNGB的独家资源。但望日后其他库也能多一些过滤或检索条件,以便更快捷的从这一国内生物信息巨制中获取有用数据。
组装库中黄色区域是设置数据来源的filter
网友评论