嵌合体(Chimeras)是PCR阶段不正常的扩增过程所产生的序列。
嵌合体由两条及以上的模板链组成,是PCR延伸阶段的不完全延伸造成的。
通常有1%的几率会出现嵌合体序列,而在16S/18S/ITS扩增子测序的分析中,由于序列间相似度较高,所以概率会更高。
在去除嵌合体的同时我们会造成一定的数据损失,是否需要去除嵌合体是一个有争议的问题,如果你不想去除嵌合体可以选择跳过这一步直接进行后续的分析。
去除嵌合体主要分为四步:
1、鉴定嵌合体
2、去除嵌合体
3、生成不含嵌合体的Phylogenetic Tree
4、生成不含嵌合体的OTU Table
Step1: 鉴定嵌合体
parallel_identify_chimeric_seqs.py \
-i pick_otus/pynast_aligned_seqs/rep_set_aligned.fasta \
-o pick_otus/chimeric_seqs.txt \
-m ChimeraSlayer \
Step2: 去除嵌合体
filter_fasta.py \
-f pick_otus/pynast_aligned_seqs/rep_set_aligned.fasta \
-o pick_otus/pynast_aligned_seqs/rep_set_aligned_chimerafree.fasta \
-s pick_otus/chimeric_seqs.txt \
--negate
#进行基本的过滤去除高变区
filter_alignment.py \
-i pick_otus/pynast_aligned_seqs/rep_set_aligned_chimerafree.fasta \
-o pick_otus/
Step3: 生成不含嵌合体的Phylogenetic Tree
make_phylogeny.py \
-i pick_otus/rep_set_aligned_chimerafree_pfiltered.fasta \
-o pick_otus/rep_set_chimerafree.tre
Step4: 生成不含嵌合体的OTU Table
make_otu_table.py \
-i pick_otus/final_otu_map_mc2.txt \
-o pick_otus/otu_table_rdp_nochimera.biom \
-t pick_otus/rdp_assigned_taxonomy/rep_set_tax_assignments.txt \
-e pick_otus/chimeric_seqs.txt
最终生成的文件:
- OTU Table (
pick_otus/chimeraslayer/otu_table_rdp_nochimera.biom
) - Phylogenetic Tree (
pick_otus/chimeraslayer/rep_set_chimerafree.tre
) - Representative Sequences (
pick_otus/chimeraslayer/rep_set_aligned_chimerafree.fasta
)
网友评论