PICRUSt2:OTU/ASV等16S序列随意预测宏基因组,参考数据库增大10倍
https://github.com/picrust/picrust2/wiki/PICRUSt2-Tutorial-(v2.1.4-beta)
-
PICRUSt2 (Phylogenetic Investigation of Communities by Reconstruction of Unobserved States)是一款基于标记基因序列来预测功能丰度的软件。
-
工具原理
- 先根据已测微生物基因组的16S rRNA基因全长序列,推断它们的共同 祖先的基因功能谱;
- 对Greengenes数据库中其它未测物种的基因功能谱进行推断,构建古菌和细菌域全谱系的基因功能预测谱;
- 最后,将测序得到的菌群组成“映射”到数据库中,对菌群代谢功能 进行预测。
- 安装
conda create -n picrust2 -c bioconda -c conda-forge picrust2
source activate picrust2
- 测试数据
- whether knocking out the protein chemerin affects gut microbial composition.
wget http://kronos.pharmacology.dal.ca/public_files/tutorial_datasets/picrust2_tutorial_files/chemerin_16S.zip
unzip chemerin_16S.zip
cd chemerin_16S
- 产生三个数据
metadata.tsv
seqs.fna
table.biom
- seqs.fna
>86681c8e9c64b6683071cf185f9e3419
CGGGCTCAAACGGGGAGTGACTCAGGCAGAGACG
>663baa27cddeac43b08f428e96650bf5
CGGGCTCAAACGACGGATGAATACTTTTGAAAGGA
- table.biom
biom head -i table.biom
# Constructed from biom file
#OTU ID 100CHE6KO 101CHE6WT 102CHE6WT 103CHE6KO 104CHE6KO
86681c8e9c64b6683071cf185f9e3419 716.0 699.0 408.0 580.0 958.0
b7b02ffee9c9862f822c7fa87f055090 51.0 98.0 96.0 91.0 223.0
数据预处理
1.罕见asv 要删除
- 删除低深度样品
网友评论