美文网首页自然科学之文献阅读
3810 粪便宏基因组组装

3810 粪便宏基因组组装

作者: Thinkando | 来源:发表于2020-07-29 17:52 被阅读0次

鉴于现在培养微生物的技术平台限制,尚有很多肠道微生物的基因组未知。本文收集了不同地区不同病理状态的 3,810 个粪便宏基因组数据,重建了 60,664 个原核生物基因组草图,其中 2,058 个是物种水平的新的操作分类单位(OTUs),这些新物种-OTUs 将肠道细菌分类类群增加了 50%,同时就个体水平而言,新物种-OTUs 占健康个体肠道菌群丰富度的 33% 和物种丰度的 28%,且主要富集于来自农村人群中。

与临床数据的关联分析发现,新物种-OTUs 与一些疾病相关,且能改善疾病预测模型。最后,本研究发现尚未培养细菌基因组趋于变小,导致一些保守代谢通路缺失以至于无法培养,所以本研究的方法将为探索细菌功能和培养条件提供新的思路。

关键字: 肠道细菌参考基因组, 难培养细菌, 宏基因组学

Title: Novel insights from uncultivated genomes of the global human gut microbiome

DOI: 10.1038/s41586-019-1058-x

Journal: ***Nature *** [IF 41.577]

First Authors: Stephen Nayfach

Correspondence: Stephen Nayfach and Nikos Kyrpides

Affiliation: Department of Energy Joint Genome Institute, Walnut Creek, California

Published: 2019-03-13

image

1

研究背景

肠道微生物在人类健康中扮演重要的角色,而微生物的基因组是了解特定宿主微生物功能的必要资源,但目前仍有 40-50% 人肠道微生物缺失参考基因组。虽然目前已有一些优秀培养组学研究得到一些细菌的基因组,但是限于目前培养技术及其条件的限制,仍有一些在人类中盛行的物种缺失参考基因组。

宏基因组组装是通过计算获取基因组而非分离培养。测序组装得到的 contigs 通过一组样品基于核酸频率,丰度和/或共变异丰度分箱组装成宏基因组组装基因组(metagenome-assembled genomes, MAGs)。此外,MAGs 评估指标包括了完整度、污染度、标记基因是否存在和整体连续性。

本研究假设从已经发表宏基因组数据中重现的 MAGs 能显著提高物种多样性和揭示未能培养微生物的功能。

2

研究结果

从全球宏基因组中重构基因组

本研究一共收集了来源全球的不同地区不同病理研究的 3,810 个样本(图1. a,b)。为了能保留个体之间菌株变异,减少对计算资源依赖,MAGs 的组装是基于单个样品而非 co-assembly,随后也将不正确的 contigs 去除(图1. c)。该分析流程产生的非冗余高质量 MAG 较 co-assembly 方法多了1.8倍,比之前基于样品丰度共变异的研究多了3.3倍。

参考 Global Human Gut MAG (HGM)数据库,流程一共产生超过 MIMAG (minimum information about a metagenome-assembled genome)中等质量标准的 60,664 个 MAGs,(图1. b);其中 ANI(average nucleotide identity)阈值为 99% 的 43,737 clusters 的 MAGs 是独特的;且大部分的 MAGs 不是嵌合体,因为他们同一个物种内 DNA 相似性 >98%,但物种间标记基因 DNA 相似度 <98%。

此外,依据 MIMAG 标准,24,345 个 MAGs 是高质量的(接近完成图,低污染率,高的连续性和同一物种分离培养得到的基因组相似的长度),但 14.5% 高质量 MAGs 缺少了 rRNA 基因。

虽然已经重构了大量基因组,作者仍觉得从人肠道宏基因组中重构 MAGs 存在一些挑战。

  1. 通过 reads 映射(mapping)回每个 MAGs 和量化 SNPs (single-nucleotide polymorphisms),证实了菌株多样性导致了 MAGs 的高度碎片化;

  2. 可靠地组装 MAG 需要至少 10-20 x的 read 深度,表明了每个菌落中高丰度物种才会被组装成 MAGs。MAG 装配对于某些已知的门,如拟杆菌和具有高社区多样性的宏基因组特别具有挑战性(图1. f)。

image

图 1. 从全球分布的肠道宏基因组中重构基因组

MAGs 代表着成千上万的未知物种

为了探索 HGM 数据库新的代表性的分类群,作者将 60,664 个 MAGs 和 145,917 个非冗余参考基因组基于 95% ANI 聚类到 OTU 水平。共产生 23,790 个物种水平的 OTUs,其中 4,558 个是人肠道微生物(图2. a,b)。

于是作者构建了一个 Integrated Gut Genomes Database (IGGdb) 数据库,其囊括了 156,478 个人肠道 OTUs 基因组,也包括了由 10,368 个 MAGs 构成的 2,058 个新 OTUs(新物种-OTUs)(图2. d)。基于 Gnenome Taxonomy Database (GTDB) 的注释,96% 新物种-OTUs 没能确定到种水平,69% 与所有参考基因组的 ANI 都小于 90%。

此外,相当数量(n = 3,215)的 MAGs 未能精确分类到或缺失属水平。所以作者将这些 MAGs 和参考基因组进行系统发育进化树构建以确定它们新的种系分枝,结果新增了 360 个属水平的 OTUs, 15 个科水平的OTUs 和 2 个目水平的 OTUs (图2. d)。累积曲线也表明了除种水平以外的属水平以上的分类基本已达到饱和。

综上所述,来自新 OTUs 的 MAGs 代表了已测序肠细菌总系统发育多样性(phylogenetic diversity,PD)的 70.9%,并与单独的参考基因组相比 PD 增加了 50.0%

新物种-OTUs 分布在各大分类水平上,尤其是厚壁菌目的 Lachnospirales 和 Oscillospirales 有明显增加,在拟杆菌门发现近 400 个新 OTUs。相反地,古菌几乎没有发现新的 OTUs,即使它的 MAGs 比较容易组装(图1. f),也就是说大多数的人体肠道中古菌已经被测序了。此外,几个大的分枝如 Cyanobacteria 和 Clostridia 并没有代表的高质量基因组,可能解释是其基因组在变小或者有未知因素干预基因组组装。

总之,这些结果皆表明了新物种-OTUs 增加了 HGM 数据库细菌的多样性扩展了肠道细菌进化树

image

图 2. 人肠道 MAGs 扩展了肠道细菌的基因组多样性

新物种-OTUs 在人群中的分布

虽然已经有一些软件能确定物种丰度谱,但是不适用于本研究 MAGs 数据,故作者霸气地开发了 IGGsearch,它与 MetaPhlAn 策略类似,通过将宏基因组 reads 与 MAGs 和参考基因组比对鉴定单拷贝,物种特异基因以快速计算 23,790 个物种 OTUs 的丰度。基于基准数据集,IGGsearch 能准确地量化了 OTU 丰度和存在缺失。

IGGsearch 分析结果显示新物种-OTUs 占丰富度的 33.4%,和每个健康个体样本 27.7% 的相对丰度,这数值与宏基因组中未被组装或分箱通常被删除处理数据的丰度相似,故检测不到这些 MAG。

新物种-OTUs 主要出现在农村人群中(Tanzania 、Peru、Mongolia、Fiji 和 El Salvador),但是在欧美婴儿(图2. f)也有一定比例。富含这些新物种-OTUs 的群体中并没有发现健康与疾病组之间的显著差异。

综上所述,这些结果启示了本研究发现的新的未被培养物种 OTUs 在健康人群肠道微生物中占很大一部分且普遍分布在非西方化人群中

image

图 3. 新的肠道物种广泛分布在分类群体中

肠道微生物与疾病关系

人肠道微生物已被报道与大量疾病相关,且被用于探索疾病的病理、临床诊断、构建预测模型。作者用 10 个不同的临床表征的微生物组研究探索新发现的 2,058 个新物种-OTUs 与疾病状态的关联,其中6个研究项目未用于前面的 MAG 重构。

来自 IGGdb 的物种-OTUs 与疾病状态整个宏基因组的关联结果显示 2,283 个物种与疾病关联(FDR <1%),包括了疾病或对照组富集的 OTUs ,其中近 40% 差异显著关联物种是新物种-OTUs 。例如,AS (ankylosing spondylitis) 与新物种 Negativicutes 纲(OTU-14148)有显著关联,相对健康对照组,患者组显著减少,而且比参考基因组最强相关物种还显著差异8个数量级。

作者还将用三个常见的工具 MIDAS、mOTU 和 MetaPhlAn2,基于同一数据库以计算物种丰度,分别识别了 716 , 404 和 326 个物种与疾病关联,这与 IGGsearch 结果相比几乎减少了5倍。此外,每种工具得到物种丰度去构建随机森林模型预测疾病状态,发现 IGGsearch 丰度谱更能构建出具预测性的模型,尤其是对结直肠癌,心血管疾病,2型糖尿病和类风湿性关节炎有显著改善。但未来仍需要更多的工作来揭示相关物种如何与病理联系以及这些结果是否在其他人群中重现。

image

图 4. 整个宏基因组的肠道 OTU 与人类疾病的关联

尚未培养肠道细菌基因组在变小

先前针对环境群体的 MAG 的研究揭示了大型未培养细菌谱系具有不寻常基因组特性,包括基因组变小,复制速度变慢以及缺乏保守基因。

令人惊讶的是,人类肠道细菌也存在这种现象。来自肠道分离培养物种和未培养物种-OTU 的比较基因组分析结果显示,尚未培养的 OTUs 基因组趋于变小,在放线菌,杆菌,梭菌,拟杆菌和变形菌均有体现(图5. a)。虽然先前已有研究报道人类肠道分类群基因组趋向变小(TM7 和 Melainabacteria),但这是第一次以这种规模报道这种模式。此外,其他基因组特征,包括预测的复制率,编码密度和GC含量,在培养的和未培养的OTU之间没有差异。

鉴于基因组变小的趋势,作者使用系统发育逻辑回归来识别未培养的 OTUs 中常见的功能。发现 1,492 个 KEGG orthology groups(KOs;总数的21.5%)差异显著(FDR <1%),其中大部分在尚未培养的 OTUs 中显著减少(图5. c)。这些模式在 MAGs 和同物种的分离基因组之间是保持一致的,不受用于功能注释的数据库的影响。同时,发现如与维持渗透压和保护氧化应激有关的功能也有所缺失,这可能表明尚未培养的细菌转至培养基培养未必可行,或者其对宿主体外的氧更敏感。

上述模式最明显的就是 RF39 (一个基因组变小,营养缺陷型的 Bacilli 纲尚未培养的目)(图5. c)。虽然之前研究有检测到 RF39 但对这个组鲜有报道,而在本研究中的大部分宏基因组中都有发现 RF39 (图3)。RF39 所有基因组几乎完全缺失一些高度保守的代谢通路,包括脂肪酸(FAs)、一些氨基酸和维生素生物合成。FAs 生物合成完全缺失是异乎寻常的,因为脂肪酸是细胞壁的主要成分,是细胞的持家(housekeep)功能。这些机体可能类似厚壁菌门一样可以将外源的 FAs 掺入膜磷脂中。

image

图 5. 未培养的 OTU 基因组变小且缺失共同的生物学功能

3

讨论与总结

① 本研究对大规模宏基因组数据进行组装和分箱,重构得到大量尚未培养的物种-OTUs,并开发了便于日后人肠道微生物科学研究的 IGGdb 和 IGGsearch。

② 虽然重构了大量的 MAGs ,但是 MAGs 的组装仍存有挑战,如低物种丰度,菌株高度多样化,一些门的低重现率等;

③ 新物种-OTUs 主要分布在非西方人群中,故未来宏基因的研究应该更加关注除欧洲、美国和中国以外的其他地区;

④ 本研究令人意外的一个结果是人类肠道中的大多数微生物多样性目前不是由培养分离物种代表的;

⑤ 本研究提供的 MAG 方法可用于改善培养条件或鉴定未培养的人类肠道物种的培养条件;

⑥ 发现尚未培养细菌的基因组趋于变小,正如 Black Queen 假说一样,是趋于利用公共资源的适应过程,这仍需要更多工作研究验证。

方法

  1. 从NCBI 下载3810 个样本,来自15个研究
  2. megahit
  3. metawrap(maxbin,metabat,concoct)
  4. DAS tool, 将上面三个分享结果整合
  • Contigs shorter than 1 kb were discarded.
  1. blastn 去hg38 phix

相关文章

  • 3810 粪便宏基因组组装

    鉴于现在培养微生物的技术平台限制,尚有很多肠道微生物的基因组未知。本文收集了不同地区不同病理状态的 3,810 个...

  • Bacteria genome denovo assembly

    细菌基因组组装金标准:GAGE-B 组装软件的选择 细菌基因组组装的目标不同于大型生物基因组的组装,大型基因组组装...

  • 常用转录组组装软件集合

    转录组组装软件 基因组组装 基因组组装(Genome assembly)是指使用测序方法将待测物种的基因组生成序列...

  • 基因组结构注释

    1. 组装基因组质控 得到组装好的基因组序列之后,首先要使用多种方法评估组装质量。这里用到2款可用于基因组组装质量...

  • 基因组 组装教程 (T2T)

    导读 本文将介绍T2T基因组,并提供一份基因组组装的资料,其中包含:基因组组装数据和组装策略介绍;染色体水平基因组...

  • 「干活」基因组组装 学习笔记 - 入门知识点和Genome Su

    基因组组装学习笔记(一) 基因组组装的前期工作:需要掌握什么知识点? 1)基因组大小 / genome size:...

  • 基于参考基因组的基因组组装和注释

    将基因组组装到染色体水平无非就是两种方式: 独立组装(de novo); 基于参考基因组的组装(reference...

  • 02-Hi-C辅助基因组安装

    基因组组装 基因组是怎么组装的,目前的方法有什么局限性?为什么要进行基因组组装?是因为目前的测序方法,无论是一代、...

  • 纯二代测序从头组装基因组

    基因组组装 基因组组装一般分为三个层次,contig, scaffold和chromosomes. contig表...

  • 基因组组装----SOAPdenovo2

    1.基因组组装的流程 基因组组装的大概流程如下: (1) 测序得到raw reads序列。 (2) Reads质量...

网友评论

    本文标题:3810 粪便宏基因组组装

    本文链接:https://www.haomeiwen.com/subject/zgfkrktx.html