美文网首页宏基因微生物16s测序分析
16S测序分析(六)用PICRUSt预测菌群KEGG代谢通路

16S测序分析(六)用PICRUSt预测菌群KEGG代谢通路

作者: 胡童远 | 来源:发表于2020-09-11 17:24 被阅读0次

    导读

    PICRUSt (Phylogenetic Investigation of Communities by Reconstruction of Unobserved States) 的原理基于已测细菌基因组的16S rRNA全长序列,推断它们的共同祖先的基因(同源基因)功能谱,对Greengenes数据库中其它未测物种的基因功能谱进行推断,构建古菌和细菌域全谱系的基因功能预测谱,最后,将测序得到的菌群组成“映射”到数据库中,对菌群代谢功能进行预测。

    文献:
    Predictive functional profiling of microbial communities using 16S rRNA marker gene sequences. Nature Biotechnology 2013

    一、数据准备

    1 QIIME2 DADA2分析的输出文件

    1.1 rep-seqs.qza ## 代表性序列
    1.2 table.qza ## 代表性序列丰度表,如下:

    (导出qza文件的方法将在下面介绍)

    2. Greengene细菌模板数据

    下载地址:https://docs.qiime2.org/2019.1/data-resources/

    下载得到gg_13_5_otus.tar.gz(最新版,大小为304M)后将其解压得到97_otus.fasta(最新版,大小约为139M),文件获取如下:

    二、工作流程

    1. 格式转换

    将97_otus.fasta命名为gg_13_5_97_otus.fasta,并将其格式转化成QIIME2 qza格式

    qiime tools import \
     --type 'FeatureData[Sequence]' \
     --input-path gg_13_5_97_otus.fasta \
     --output-path gg_13_5_97_otus.qza
    

    2. 聚类

    参考QIIME2官方文档:https://docs.qiime2.org/2018.8/tutorials/otu-clustering/

    qiime vsearch cluster-features-closed-reference \
     --i-sequences rep-seqs.qza \
     --i-table table.qza \
     --i-reference-sequences gg_13_5_97_otus.qza \
     --p-perc-identity 0.97 \
     --p-threads 10 \
     --output-dir picrust/closed_ref_97_otu
    

    3. 将qza格式转换biom格式

    qiime tools export --input-path closed_ref_*_otu/clustered_table.qza --output-path closed_ref_*_otu/
    

    4. 将biom格式转成tsv格式

    biom convert --to-tsv -i feature-table.biom -o feature-table.tsv
    

    这样就得到了OTU丰度表feature-table.tsv。接下来用PICRUSt(网址:http://huttenhower.sph.harvard.edu/galaxy/)进行在线菌群代谢功能预测,步骤如下:

    三、PICRUSt预测菌群KEGG通路

    1 上传数据

    1.1 点击上传控件

    1.2 选择上传格式和需要上传的本地文件;点击Start开始上传;点击Close返回

    2 数据标准化

    按如下操作:

    3 KEGG代谢通路预测

    按如下要求操作:

    4 功能分类

    按如下要求操作:

    5 下载预测结果

    6 菌群KEGG预测结果

    相关阅读:
    16S测序分析(一)菌属丰度表获取
    16S测序分析(二)菌群多样性分析
    16S测序分析(三)用LEfSe寻找组间差异细菌
    16S测序分析(四)用MaAsLin寻找组间差异细菌
    16S测序分析(五)用RandomForest寻找关键细菌

    相关文章

      网友评论

        本文标题:16S测序分析(六)用PICRUSt预测菌群KEGG代谢通路

        本文链接:https://www.haomeiwen.com/subject/hfjbektx.html