PICRUSt2
PICRUSt2(Phylogenetic Investigation of Communities by Reconstruction of Unobserved States)是一款基于标记基因序列来预测功能丰度的软件。“功能”通常指的是基因家族,如KEGG同源基因和酶分类号,但可以预测任何一个任意的特性。同样,预测通常基于16S rRNA基因测序数据,但也可以使用其他标记基因.
image
PICRUSt2相关使用方法来啦!!!
一、安装
使用 bioconda 安装 PICRUSt2 环境
conda create -n picrust2 -c bioconda -c conda-forge picrust2
激活环境
source activate picrust2
退出环境
source deactivate picrust2
二、准备数据
PICRUSt2无需再以GreenGene注释的OTU表为输入,可以直接读取OTU的代表序列自动完成物种注释,并进一步根据物种丰度组成预测群落功能。文件otu_table.txt为OTU丰度表格,仅包含丰度组成信息即可,无需添加注释列。文件otu.fasta中包含了OTU丰度表中各OTU的代表序列。
三、使用
picrust2_pipeline.py -s otu.fasta -i otu_table.txt -o picrust2_result -p 4
image
四、结果文件
1)out.tre,所有OTU代表序列构建的系统发育树文件。
2)KO_metagenome_out/,该结果路径中记录了细菌群落KO(KEGG Orthology)功能的丰度预测结果。
3)KO_metagenome_out/seqtab_norm.tsv.gz,对于很多细菌而言,一个个体可能包含多条16S(多拷贝16S),因此在原始OTU 16S rRNA丰度表的基础上,根据物种所含16S rRNA拷贝数对物种丰度进行标准化,得到校正16S rRNA拷贝数后的OTU丰度表。
4)KO_metagenome_out/pred_metagenome_unstrat.tsv.gz,该文件中即为预测得到的细菌群落功能丰度表,记录了各样本中所包含KO功能的丰度,丰度计算由上述校正16S rRNA拷贝数标准化后的OTU丰度表推断得到。功能以KO ID为名称,代表了特定的功能基因。
5)KO_metagenome_out/weighted_nsti.tsv.gz,各样本预测功能的加权NSTI值,由OTU的NSTI值通过标准化后的丰度加权所得。
6)EC_metagenome_out/,该结果路径中记录了细菌群落酶(EC)功能的丰度预测结果。文件结构同上述KO_metagenome_out/,不再展示。
7)pathways_out/path_abun_unstrat.tsv.gz,上述为预测得到的以KO ID为名称的KO功能,实则代表了特定的功能基因,将这些功能基因映射到具体的KEGG代谢途径(KEGG pathway)中,并统计各途径在各样本中的丰度,获得该表。
8)KO_predicted.tsv.gz和EC_predicted.tsv.gz,两个矩阵文件中记录了OTU对预测功能丰度的贡献,即可以理解为每个OTU所代表的物种个体基因组中,分别有多少数量的基因与对应的KO功能或酶功能有关。如果期望关注哪些OTU是否对群落功能是重要的,这些表格(该表仅代表了单个物种个体基因组的特征,可能还需结合OTU的丰度信息)可以提供参考。
9)marker_predicted_and_nsti.tsv.gz,记录了OTU代表物种基因组中,16SrRNA拷贝数以及功能预测的NSTI值信息。
10)Intermediate/,一些中间文件。
image
END
网友评论