基于高通量测序技术,我们可利用宏基因组数据中组装得到的MAGs来研究微生物生态学。这种技术使构建微生物的基因组图谱,破译微生物的功能和活动,使重建其在生物地球化学过程中的作用研究成为可能。虽然目前已有的基因组数据分析工具可在一定程度上注释和描述代谢功能,但缺乏全面的下游分析处理,包括代谢预测、代谢物交换、微生物相互作用和微生物对生物地球化学循环的贡献等。针对上述问题,威斯康星大学麦迪逊分校的研究人员,开发了一个新工具:METABOLIC,用以进行微生物基因组及宏样本中单菌基因组组装,来分析微生物的代谢功能网络。
METABOLIC的分析流程
METABOLIC的撰写基于Perl及R语言,可在Unix、Linux或macOS上运行。该工具的输入文件是FASTA格式的微生物基因组序列或宏基因组MAGs序列以及通过自定义HMM数据库的注释蛋白序列。其分析流程包括:
(1) 利用Prodigal工具对基因组基因预测;
(2) 通过6个数据库进行代谢功能注释(KOFAM,Pfam, MEROPs,TIGRfam,dbCan2和自定义HMM数数据库);
(3) motif validation:为增加注释的可信度,将蛋白序列上的motifs与自建的高度保守的蛋白质残基序列数据库HMM进行比较;
(4) 将测序数据比对到基因集上,得到的基因丰度数据可用以计算代谢网络模块的丰度(可选);
(5) 用GTDBTK工具对微生物基因组或者MAGs做分类注释;
(6) 输出包括6个不同的结果,同时给出MW-score (metabolic weight score),这个指标可以反映共享功能网络中的微生物群落的功能能力和丰度。
图1 METABOLIC的分析流程可视化输出及应用
1、生物地球化学循环可视化
在METABOLIC生成蛋白质和途径注释结果后,该工具进一步识别并强调了与能量代谢和生物地球化学相关的微生物组中重要的特定途径。为可视化展示生物地球化学重要性的途径,为每个基因组生成氮、碳、硫和其他元素循环的示意图。
图2 氮、硫和碳循环的示意图2、顺序反应的定量可视化
METABOLIC总结并可视化了参与重要无机和有机化合物顺序转化的微生物的基因组数量和覆盖率(相对丰度)。此外,它直观显示了能够进行特定途径的微生物数量和丰度,可反映微生物群落的快速复原能力。
图3 顺序反应定量示意图 ; A无机化合物的顺序转化 B有机化合物的顺序转化3、功能网络的计算和可视化
METABOLIC产生的微生物代谢途径丰度信息,可以确定微生物基因组中共存的代谢。在生物地球化学的背景下,这种方法可以评估生物地球化学步骤之间的关联性和微生物的连接贡献。下图以栖息在深海热液喷口的微生物群落作为例子,展示了METABOLIC构建的功能网络。
图4 显示微生物群落中不同功能之间的联系的功能网络(节点代表生物地球化学循环中的各个步骤,连接的边表示节点之间的功能连接)4、微生物群落代谢功能贡献的可视化
为了解与特定代谢和生物地球化学转化有关的微生物群体的贡献,METABOLIC将特定分类群、代谢反应和整个生物地球化学循环(如碳、氮和硫循环)之间的联系可视化。方法包括使用Sankey图(也称为"桑基图")来表示一个特定群落中各微生物群体贡献的代谢功能比例。
图5 桑基图5、METABOLIC性能演示
为了展示METABOLIC在不同样本中的应用和性能,测试了8种不同的环境的数据(海洋地下、陆地地下、深海热液喷口、淡水湖、结直肠癌患者的肠道微生物组、健康对照的肠道微生物群、草甸土壤、废水处理设施)。总的来说,METABOLIC在所有环境中都表现良好,可以分析具有功能性状和生物地球化学循环的微生物基因组。
图6 基于MW-scores的代谢比较 ;A陆地地下(左红色条)和海洋海底(右蓝色条)之间的比较;B深海热液喷口(左红条)与淡水湖(右蓝条)的对比 图7 两个微生物基因组的细胞代谢图 图8 结肠直肠癌(CRC)患者和健康对照肠道样本的人类微生物组代谢的存在/缺失图谱总之,微生物基因组在个体和群落尺度上的代谢功能剖析,对于全面了解生态系统过程至关重要。本研究开发的代谢功能分析工具:METABOLIC将基因组信息整合到代谢和生物地球化学模型中,使得微生物代谢和生物地球化学的解释更加容易,跨领域微生物组研究成为可能。
参考文献
METABOLIC: high-throughput profiling of microbial genomes for functional traits, metabolism, biogeochemistry, and community-scale functional networks
https://doi.org/10.1186/s40168-021-01213-8
网友评论