文章:DRAM for distilling microbial metabolism to automate the curation of microbiome function
中文:
杂志:Nucleic Acids Research
时间:2020
微生物和病毒群落改变了地球生态系统的化学性质,但由于缺乏可扩展的、代谢解析的注释软件,这些生物引擎催化的特定反应很难解码。在这里,我们提出了 DRAM(代谢的蒸馏和精炼注释),这是一个将大量基于微生物组的基因组信息转化为微生物特征目录的框架。为了证明 DRAM 在不同代谢基因组中的适用性,我们评估了 DRAM 在定义的硅土群落和先前发表的人类肠道宏基因组上的性能。我们表明 DRAM 准确地分配了微生物对地球化学循环的贡献,并在底物水平自动分配了肠道微生物碳水化合物代谢。 DRAM-v 是 DRAM 的病毒模式,它建立了识别病毒编码的辅助代谢基因 (AMG, auxiliary metabolic genes) 的规则,从而对来自土壤和肠道的数以千计的推定 AMG 进行代谢分类。 DRAM 和 DRAM-v 一起提供了关键的代谢分析能力,可以破译支持微生物组功能的机制。
DRAM工作方式
DRAM-v先用prodigal进行基因预测,在用数据库做注释
![](https://img.haomeiwen.com/i19404765/8095c374dc9b0918.png)
DRAM提供更多的注释信息
![](https://img.haomeiwen.com/i19404765/56f0b858eca08684.png)
DRAM-v分析病毒中的AMG
![](https://img.haomeiwen.com/i19404765/c7c1edc344ae1275.png)
Github: https://github.com/shafferm/DRAM
wiki: https://github.com/shafferm/DRAM/wiki
安装
wget -c https://raw.githubusercontent.com/shafferm/DRAM/master/environment.yaml
conda env create -f environment.yaml -n DRAM
conda activate DRAM
数据库
# don't have access to KEGG
DRAM-setup.py prepare_databases --output_dir DRAM_data
# have access to KEGG
DRAM-setup.py prepare_databases --output_dir DRAM_data --kegg_loc kegg.pep
![](https://img.haomeiwen.com/i19404765/d233d4a54ece7fb0.png)
注释和数据整理
DRAM.py annotate -i 'my_bins/*.fa' -o annotation
DRAM.py distill -i annotation/annotations.tsv \
-o genome_summaries \
--trna_path annotation/trnas.tsv \
--rrna_path annotation/rrnas.tsv
网友评论