一、数据库简介
gnomAD是目前收录范围最广的基因组变异数据库之一,包含了全世界各人种的变异数据。gnomAD 与有较长历史的dbSNP的主要不同点在于,dbSNP包括了通过各种各样研究方法不同的项目而发现的基因组变异,dbSNP对这些变异加以整理,给予ID,但 gnomAD 为了能够正确的算出等位的频率,对所纳入样本的二代测序数据进行了统一标准的解析,这是 gnomAD 的一大特点。另外,对于50bp以上的基因组结构变异, gnomAD 也有着较高质量的数据。
目前版本 gnomAD v3.1 所包含数据汇总如下:
gnomAD 的前身是ExAC (Exome Aggregation Consortium), ExAC 只包含外显子组数据,目前已经被 gnomAD 取代。 gnomAD 的主要资助者是 the Broad Institute。
gnomAD的主页:https://gnomad.broadinstitute.org/
二、搜索基因
以ALDH1A1为例,页面最上端显示了基因的基本信息,右边Dataset处可以选择不同的subset(例如 non-cancer, non-neuro等等),Constraint处显示了synonymous,missense 以及 pLoF(基因丧失功能的可能性)的统计值,接下来的图标显示了每个部分的测序深度。
点击 show transcript 或者 show tissue也可以看到不同的transcript 或是在不同组织中的表达。
接下来是ClinVAr中收录的变异位点,与gnomAD中收录的位点的位置信息。
最后则是对变异位点的功能注释:
三,搜索变异
以ALDH2上的rs671为例,
我们可以找到该变异在数据库中的基本信息,包括频数,频率等,之后紧跟着对该变异的注释:
之后是该变异在ClinVar数据库中的信息:
然后是该变异在各群体中的详细的频率信息,以及年龄分布信息。
gnomAD还提供了该变异的质量信息。
最后还提供了便捷的浏览器,可以直观地在基因组中浏览该变异。
gnomAD内所有的信息均提供免费的下载服务,如果有需要也可以按需下载。
网友评论