标题:De novo identification of microbial contaminants in low microbial biomass microbiomes with Squeegee
期刊:Nature communications
发表时间:2022-10-25
目的:
de novo去除宏基因组测序(metagenomic sequencing)过程中引入的污染
亮点:
De novo去除污染,无需额外其他信息,如阴性对照或者样品DNA浓度
原理:
基于假设:污染的物种在不同样品中会有相似的特征
![](https://img.haomeiwen.com/i14719393/67e5886ab6c39a30.png)
污染鉴定考虑以下指标:
- Prevalence Scoring: prevalence score针对不同样本类型加权,避免样本类型数量不同引入的偏差。score越高,物种在不同类型样本中更共享,更可能是污染
- Metagenome Distance scoring:Mash计算不同样本之间的差异。值越大,差异越大。差异越大的样本共享的物种更可能是污染。
- Breadth of Genome Coverage Scoring和Classification Error Detection:使用Bowtie2将reads比对回潜在的污染物种参考基因组,计算覆盖度和深度,判定物种是否真实存在于样本中。通常覆盖度越大,证明物种真实存在;如果大量的reads只覆盖一小部分基因组,一般为错误分类。
网友评论