微生物多样性qiime2分析流程(4) 训练特征分类器进行16s

作者: R语言数据分析指南 | 来源:发表于2020-10-13 13:12 被阅读0次

微生物多样性qiime2分析流程(7) 运用blast比对方法对
微生物多样性qiime2分析流程(4) 训练特征分类器进行16s
微生物领域的机器学习
还在用QIIME1，你就OUT了，快来试试QIIME2吧！
【微生物系列专题】宏基因组分析流程及常见结果解读
基于R语言的微生物群落组成多样性分析——α多样性及其可视化
16s α多样性指数计算和可视化
qiime2软件的下载
16S测序分析（二）菌群多样性分析
微生物生信分析相关网站

经过前面的分析步骤，我们得到了特征表，代表序列及进化树文件，并更改了其名称；接下来就让我们根据silva 138数据库训练特征分类器来对代表序列进行注释:

1.导入参考序列数据库

time qiime tools import \
--type 'FeatureData[Sequence]' \
--input-path silva.16s_bacteria.fasta \
--output-path silva.16s_bacteria.qza

2.导入物种分类注释数据库

time qiime tools import \
--type 'FeatureData[Taxonomy]' \
--input-format HeaderlessTSVTaxonomyFormat \
--input-path silva.16s_bacteria.tax \
--output-path ref_silva.16s_bacteria.tax.qza

3. 训练分类器

time qiime feature-classifier fit-classifier-naive-bayes \
--i-reference-reads silva.16s_bacteria.qza \
--i-reference-taxonomy ref_silva.16s_bacteria.tax.qza \
--o-classifier classifier.qza

注：此步骤特别耗费时间，在132G的服务器上运行此程序耗时64h，无特殊需求可直接使用官网提供训练好的数据库:
https://data.qiime2.org/2020.8/common/silva-138-99-nb-classifier.qza

4. 数据注释

这一步输入我们得到的代表序列文件，对其进行分类注释

time qiime feature-classifier classify-sklearn \
--i-classifier classifier.qza \
--i-reads rep-seqs.qza \
--o-classification taxonomy.qza

注:128G服务器41个样本用时3h，个人8G电脑请不要尝试
同时也可以用blast比对的方法来进行数据注释，
参考：https://www.jianshu.com/p/85e7930f710d

5. 可视化注释的结果

time qiime metadata tabulate \
--m-input-file taxonomy.qza \
--o-visualization taxonomy.qzv

网友评论

本文标题：微生物多样性qiime2分析流程(4) 训练特征分类器进行16s

本文链接：https://www.haomeiwen.com/subject/kzcvpktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

微生物多样性qiime2分析流程(4) 训练特征分类器进行16s

1.导入参考序列数据库

2.导入物种分类注释数据库

3. 训练分类器

4. 数据注释

5. 可视化注释的结果

相关文章

微生物多样性qiime2分析流程(7) 运用blast比对方法对

微生物多样性qiime2分析流程(4) 训练特征分类器进行16s

微生物领域的机器学习

还在用QIIME1，你就OUT了，快来试试QIIME2吧！

【微生物系列专题】宏基因组分析流程及常见结果解读

基于R语言的微生物群落组成多样性分析——α多样性及其可视化

16s α多样性指数计算和可视化

qiime2软件的下载

16S测序分析（二）菌群多样性分析

微生物生信分析相关网站

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读