PICRUSt2 (Phylogenetic Investigation of Communities by Reconstruction of Unobserved States)是一款基于标记基因序列来预测功能丰度的软件。
“功能”通常指的是基因家族,如KEGG同源基因和酶分类号,但可以预测任何一个任意的特性。同样,预测通常基于16S rRNA基因测序数据,但也可以使用其他标记基因。
在这个帮助文档中,您可以找到脚本、安装说明和工作流的描述。有关详细信息,请参见github wiki的右侧栏。
PICRUSt2包括这些改进以及与原始版本相比的其他改进:
- 允许用户预测任何16S序列的功能。来自OTU或扩增序列变体(amplicon sequence variants,ASV,例如DADA2和Deblur输出)的代表性序列可通过序列放置方法用作输入。
- 用于预测的参考基因组数据库扩大了10倍以上。
- 从Castor R包中添加隐藏状态预测算法。
- 允许输出MetaCyc 本体预测,这将可与普通宏基因组学的结果比较。
- 通路丰度的推断现在依赖于MinPath,这使得这些预测更加严格。
Installing
conda create -n picrust2 -c bioconda -c conda-forge picrust2=2.3.0_b
conda activate picrust2
FlowCharts
PICRUST2Run Script
The entire PICRUSt2 pipeline can be run using a single script, called picrust2_pipeline.py. This script will run each of the 4 key steps outlined on this wiki: (1) sequence placement, (2) hidden-state prediction of genomes, (3) metagenome prediction, (4) pathway-level predictions.
picrust2_pipeline.py -s study_seqs.fna -i study_seqs.biom -o picrust2_out_pipeline -p 1
参考:
https://blog.csdn.net/woodcorpse/article/details/89302863
https://github.com/picrust/picrust2/wiki/Installation
网友评论