倒腾学习了一段时间的qiime1和qiime2,决定苦心整理一下学习成果。虽然不知道啥时候才能更完。主要参考下述网站的分析流程:https://twbattaglia.gitbooks.io/introduction-to-qiime/content/macqiime.html 但是会增加一些关于R绘图相关的。
Overview
本系列将分成以下几个部分:
- 处理加工FASTQ序列文件生成OTU table
- OTU table的处理
-
Alpha多样性分析:
Alpha Rarefaction,计算 Alpha Diversity -
Beta多样性分析:
计算 Beta多样性,距离箱形图,PCoA -
分类学组成和丰度:
Taxa Summary图,丰度差异,关联性分析,核心物种分析 - 预测16S宏基因组数据的功能(PICRUSt)
- 线性判别分析效应(LEfSe)
Before Getting Started
1、理解16S rRNA data
OTU是什么?
OTU(operational taxonomic units),即操作分类单元。通过一定的距离度量方法计算两两不同序列之间的距离度量或相似性,继而设置特定的分类阈值,获得同一阈值下的距离矩阵,进行聚类操作,形成不同的分类单元。
具体详解可以参考这个帖子:http://www.dxy.cn/bbs/topic/35655953
与Qiime相关的文章
- Conducting a Microbiome Study
- QIIME allows analysis of high-throughput community sequencing data
- Global patterns of 16S rRNA diversity at a depth of millions of sequences per sample
- Quality-filtering vastly improves diversity estimates from Illumina amplicon sequencing
- Advancing our understanding of the human microbiome using QIIME
- Stability of operational taxonomic units: an important but neglected property for analyzing microbial diversity
- Waste Not, Want Not: Why Rarefying Microbiome Data Is Inadmissible
- Robust methods for differential abundance analysis in marker gene surveys
Alpha多样性
- Kumar-UAB Diversity Presentation
- An Introduction to Applied Bioinformatics
- Wikipedia Diversity Index Entry
- Measurements of Biodiversity
- Measuring the diversity of a single community
- Werner Lab QIIME Overview
- Coloss Honey Bee Research Association
- Wikipedia Rarefaction Entry
2、常用命令
在使用qiime的过程中我们需要了解一些基本的命令,以及命令的格式:
查看命令帮助 command_name.py -h
列出文件 ls
读取和运行命令的基本格式 scriptname.py -i input_file.txt -o output_folder
切换工作目录 cd / cd ..
创建目录 mkdir
新建txt文件 touch new_file.txt
给文件/文件夹命名的是时候避免使用空格,可以用下滑线_替代
使用斜杠符号\使长命令可读性增加
安装wget命令
# 检查wget是否安装
wget --version
# 安装wget(如果需要)
sudo easy_install wget
3、务必记录你的所有命令
前人血泪教训,因为我们会对OTU table执行不同的操作,比如过滤等等,所以为了能够确保有迹可循,所以请记录你在分析过程中的所有命令
你可以记录在Sublime等编辑器里或者新建一个txt文件
一个典型命令的记录方式(记得写注释):
# Keep only the time point 'Day 28' in a new biom and mapping files.
filter_samples_from_otu_table.py \
-i otu_table.biom \
-o otu_table_noday0.biom \
-m mapping_file.txt \
-s 'Day:28'
4、Qiime1的常用文件
- 16s_pickotu_param.txt - Parameters text file for OTU picking. 提取OTU时的参数文件
- otu_table.biom - Processed OTU table for running most analyses.用于后续分析的OTU table
- mapping_file.txt - A metadata file corresponding to the OTU table. metadata文件,说明样本情况
- rep_set.tre - A phylogenetic tree corresponding to the OTU table.基于OTU table的系统发育树文件
- rep_set.fna - A file of representative sequences corresponding to the OTU table. 基于 OTU table的代表序列文件
网友评论