美文网首页
Cell Reports — 中国科学院生物物理研究所发布“女娲

Cell Reports — 中国科学院生物物理研究所发布“女娲

作者: 贝瑞科服 | 来源:发表于2021-11-29 10:25 被阅读0次

11月16日,中国科学院生物物理研究所何顺民课题组和徐涛课题组合作在期刊《Cell Reports》上发表了题为“NyuWa Genome resource: A deep whole-genome sequencing-based variation profile and reference panel for the Chinese population”的研究论文。该研究对中国34个行政区的2999个人基因组进行深度为26.2x 的全基因组测序和分析,并创建了名为NyuWa的基因组数据库。该资源是一个高质量公开可用的中国人口特定参考面板,包含数千个样本,目前在汉族人口中具有最佳的基因型推演性能,可为遗传和疾病研究提供有用和可靠的支持。

人类基因组遗传变异图谱是研究人口历史、遗传学和基因型-表型关联的重要资源。自2003年首个人类基因组发布以来,世界各国纷纷启动了基因组测序计划。然而,拥有庞大人口的中国还没有具体的基因组参考面板。因此,为了澄清人口结构和人口历史,助力世界上最大规模的人口基因研究,构建一个完整的、大队列和高质量的汉族群体遗传变异数据库和参考面板势在必行。

该研究对来自本中国23个行政区的2999个中国人基因样本进行全基因组测序分析,测序深度为26.2x ,基因组分析发现了7106万个SNPs 、819万个InDels,5804个单倍型和1930万个变异参考面板,构建了中国人群遗传变异图谱,研究人员将该数据资源命名为女娲(NyuWa)。将NyuWa与人类参考基因组GRCh38/hg38进行比对和分析,发现NyuWa的数据集包含2500万个新变异,包括2310万个SNP(32.5%)和190万个InDels。研究人员还专门设计了一个配套数据库(http://bigdata. ibp.ac.cn/NyuWa_variants/),以存档NyuWa资源中的SNP和InDel,并对中文数据库和其他数据库(包括1KGP3和gnomAD v3)中不同变异在等位基因中出现的频率进行分类整理。此外,该数据库也注释了变异质量指标、基因组区域注释、非同义变异影响预测、功能缺失预测、临床注释和药物基因组注释等信息。

NyuWa数据库概览(图片引自文献[1])

通过与1KGP3,Haplotype reference Consortium release 1.1 (HRC.r1.1), GAsP和TOPMed r2这4个公开可用的单倍型参考面板相比,NyuWa参考面板中有325万个特异性变异。而针对全球54个族群基因组进行评估,NyuWa在汉族、畲族、土家族、苗族、彝族、土族和纳西族等几个中国人口中有优势。包括主成分分析和子集分析的一系列分析也表明,虽然北方和南方汉族的遗传存在差异,但也能使用一个综合参考面板。为了进一步说明NyuWa在改善人类健康方面的价值,研究人员用ClinVar注释了所有变异,发现了1140个致病变异,其中包括影响药物疗效和安全性的已知位点、癌症风险位点、蛋白编码基因和LncRNA基因功能缺失的变异位点。

NyuWa参考面板对汉族基因型推演具有最佳性能(图片引自文献[1])

该研究为中国人群提供了大量高质量的基因组资源,有助于检验已知遗传变异对疾病易感性和药物反应的影响,并有利于未来的临床研究。研究结果扩展了功能缺失变异数据库,并将变异数据与表型信息相结合,为基因功能研究提供了重要的生物学见解。

参考文献

1. PengZhang, Huaxia Luo, Yanyan Li, et al. NyuWa Genome resource: A deep whole-genome sequencing-based variation profile and reference panel for the Chinese population[J]. Cell Reports, 2021.

相关文章

网友评论

      本文标题:Cell Reports — 中国科学院生物物理研究所发布“女娲

      本文链接:https://www.haomeiwen.com/subject/kwgkxrtx.html