美文网首页
英国生物库(Biobank)和牛津大学的Peter Donnel

英国生物库(Biobank)和牛津大学的Peter Donnel

作者: 黄晶_id | 来源:发表于2019-02-22 15:59 被阅读57次
    牛津大学Peter Donnelly教授

    Donnelly是维康信托中心人类遗传学研究室主任和牛津大学统计学教授,以及Genomics Plc公司CEO。他是牛津大学博士,曾任伦敦大学和芝加哥大学教授。他的早期研究工作涉及人口遗传学随机模型的开发,后来逐渐开发研究遗传和基因组数据统计方法。他和团队开发了多种广泛使用的统计算法,包括STRUCTURE和PHASE。他还领导了一个名为wWGS500的项目,在其中牛津大学与Illumina合作,对500名具有一系列临床条件的个体进行测序,以评估临床医学中全基因组测序的短期潜力,这一项目也是NHS 100000基因组计划的前身。

    英国生物样本库(UK Biobank)是目前世界上规模最大的人类遗传队列样本库,收集了全英国约50万名年龄在40-69岁参与者的遗传和表型数据。参与者需要进行健康检查,提供血液、尿液和唾液样本以及详细的个人信息,并同意研究人员对他们的健康状况进行随访。2018年10月Peter Donnelly及他们的同事们在《Nature》杂志发表了一篇开创性论文:英国生物库(Biobank)50万名参与者的全基因组遗传数据分析结果发布( 论文:The UK Biobank resource with deep phenotyping and genomic data)。报告了整个队列研究的数据集,如高分辨遗传数据,并展示了这些数据在遗传关联研究中的应用。在另一篇论文中( 论文:Genome-wide association studies of brain imaging phenotypes in UK Biobank),Stephen Smith、Jonathan Marchini 及同事报告了英国生物样本库首批8428名参与者的脑成像数据,以及3144个功能和结构脑成像表型的全基因组关联研究结果。他们发现,许多性状都是可遗传的,并揭示了许多与这些结构和功能指标相关的基因组区域。英国生物样本库的所有数据集和研究结果都作为开放获取资源向研究人员开放。事实上,已经有数百个研究项目围绕该数据库展开,报道了包括癌症、心脏病、糖尿病、中风、骨质疏松和精神分裂症在内等各种疾病新发现。

    UK Biobank储藏的大量生物样本

    Peter Donnelly教授研究小组应用精密的遗传信息新统计技术,承担了UK Biobank 内全部50万志愿者遗传信息分析工作,保证较高的数据质量,而且将可测的遗传变异数量输出从80万提高到了9600万,百倍地增加了有用数据信息。将输出与选定的基因型DNA和全人类基因组进行比较,科学家们可以准确地在非选择性部分预测DNA代码。

    UK Biobank在2006年-2010年采集并长期储存了50万名志愿者的血液样本,这些志愿者同意对其健康状况进行多年跟踪。“从那时起,为了增强资源的利用率,经费被用于以下几个方面投入:10万人的大脑、心脏和腹部MR成像(这是以前从未做过的),成立两个大型项目进一步深化整个研究所获得的遗传数据。第一步提供基因组中外显子区域的详细DNA序列信息以反映蛋白质信息,第二步将测序每个个体的全部基因组(包括不编码蛋白质的内含子)。”

    图片来源:Nature

    中国生物科技公司正在成为UK Biobank不可或缺的部分

    UK Biobank — BGI WGS

    近日,UK Biobank在其官网上公布了使用华大基因自主平台测序的50例人样品WGS数据和分析报告,供广大研究者下载使用。此次公布的数据为2018年初UK Biobank为了测试华大基因自主平台WGS数据质量而提供的48例样品和双盲测试的两个重复样本的数据。此次,UK Biobank自主发布的数据,可以更加客观的对不同测序平台进行综合评定。

    UK Biobank 官网截图
    数据结果展示
    图1 BGISEQ WGS 50例人样品数据平均结果
    高质量值,GC含量稳定,没有偏向性
    对50例样品WGS数据质量值进行统计分析,Q20平均值高达98.36%, Q30平均值高达92.59%。平均GC含量为40.3%, GC含量稳定,没有偏向性。 图2 碱基质量及GC含量分布
    高比对率,高覆盖度,低重复率
    50例样本比对率高达99.98%,唯一比对率高达90.70%,重复率低至2.29%,覆盖度高达99.1%,图3和图4显示出所有样本的数据指标分布平稳,表明测序结果稳定,体现测序数据的高一致性。图5和图6显示单个样品测序深度分布情况良好。 图3 比对率和唯一比对率分布图
    图4 测序深度和重复率分布图
    图5 全基因组每个碱基的测序深度的分布
    图6 全基因组测序深度分布情况
    从结果可以看出,BGISEQ WGS各项指标都达到行业标准,同时在duplicate rate和Mapping rate等方面表现出明显优势。研究者可以根据UK Biobank官网的指导(http://www.ukbiobank.ac.uk/uk-biobank-access-management-system-ams-user-guide-getting-started/)申请数据下载,审核通过后即可下载全部50个样品数据。

    相关文章

      网友评论

          本文标题:英国生物库(Biobank)和牛津大学的Peter Donnel

          本文链接:https://www.haomeiwen.com/subject/fzjeyqtx.html