- 来自同一物种的基因具有相似的丰度变化,根据丰度的相关性(皮尔森相关系数 PCC > 0.9),将所有样本(≥40 个样品)中的非冗余基因进行 canopy 算法聚类,聚为一类的基因簇,称为一个 CAG[26](co-abundance gene groups, CAGs)。其中每个 canopy 至少包含 3 个基因,且 90%的 canopy 基因来自 3 个以上样本。
- 通常古菌和细菌的基因数目>700,因此将基因数目大于 700 的 CAG,定义为一个 MGS。
- MGS(metagenomic species, MGS) 的注释:若 CAG 内超过 50%基因都注释到某一物种水平,将此 CAG 所属的 MGS 注释到该物种水平。 分析方法:canopy 聚类
网友评论