多样性分析
- 群落多样性主要指群落中所包含的物种数目和物种个体数的分布特征。
主要包含:
- 物种丰富度,species richness:群落中物种数目的多少
- 物种均匀度,species evenness:群落中每个物种的个体数目的分配情况,反应各个物种个体数目的均匀程度。
- 分类
α多样性
β多样性
α多样性
α多样性:主要指栖息地或群落中的物种多样性,关注局域生境下的物种数目和丰度,因此也被称为生境内的多样性(within-habitat diversity)。
Chao1指数
Chao1指数为广泛使用的丰富度指数之一,为物种丰富度的理论估计值
Sobs:观测到的物种数
n1:表示singleton ,只观测到1次的物种数目
n2:表示doubleton,观测到2次的物种数目
ACE指数
ACE指数全称为Abundance-based Coverage Estimator metric ;是利用修正因子对物种丰富度的估计值。通过低丰度物种估算还有多少没发现的物种。
n1:表示singleton数目,只观测到1次的物种数目
Sabund:高丰度物种数目,一般是丰度超过10个
Srare:低丰度物种数目,丰度小于等于10个
Cace:低丰度物种中非singleton所占比例
γ2ace:变异系数
Shannon指数
香浓-威纳指数(Shannon-Wiener)指数借用了信息论方法,在群落多样性的测度上,预测下一个个体属于什么物种,如果群落的多样性程度越高,其不定性也就越大。量化了从数据集中随机抽取的个体物种身份的不确定性。
Pi:物种𝑖的个体占群落中总个体数比例
R:物种数目
simpson指数及其变形
辛普森多样性指数=随机取样的两个个体属于不同种的概率=1-随机取样的两个个体属于同种的概率
Pi:物种i的个体占群落中总个体数比例
S:物种数目
N:群落中全部物种个体数
Ni:物种i的个体数
稀疏曲线
稀释曲线(rarefaction)是指从样品中随机抽取一定量的测序数据,统计他们所代表的物种数目,以数据量和物种数来构建的曲线。
参考脚本
# 使用 vegan 及 phyloseq 两个 R 包进行多样性分析
## 准备输入biom文件
S.biom
## 进行alpha多样性指数计算及绘制稀释曲线
Rscript alpha.R S.biom S.alpha
输出结果
S.alpha.alpha-diversity.table alpha 多样性指数
S.alpha.Rarefaction_ggplot2.pdf 稀释曲线
S.alpha.Rarefaction_orginal.pdf 稀释曲线
网友评论