安装:conda install -c bioconda python=3.6 metaphlan
根据自己的python版本自行修改python=x.x
第一次运行,如果没有相应的数据库,程序会自动下载,并检查md5。
数据库下载慢,找的别人的百度云存的:
实际用的指定到mpa_v30_CHOCOPhlAn_201901, 用最新的版本报错:Use of uninitialized value $bt2_args[2] in join or string
搜索下:https://github.com/biobakery/MetaPhlAn/issues/101
跟bowtie2比对时的一个参数有关,可以忽略。
MetaPhlAn支持PE reads,但并没有使用PE的关系,只是简单的把fq cat到一起,当做2条跑的。
也可以分开跑,首先跑bowtie2比对:
比对率特别低,不明白。于是找来文献看。MetaPhlAn是根据marker gene(选取单拷贝的CDS序列,约占真个细菌基因的4%),进行精准的物种鉴定。不是全选择16S基因(16s基因是多拷贝,但在特定菌种里拷贝数恒定)。用于宏基因组(非16S测序,非宏转录组)测序的快速物种鉴定分析。自带相对丰度计算、绘图功能。
选取marker占基因的4% 在本clade里保守;与其他的clade相似性低 选择的CDS序列都是单拷贝的,为了做定量计算;所以,这个软件我个人认为仅适用于宏基因组测序的数据!不能用于16S或者宏转录组!
参考:
https://huttenhower.sph.harvard.edu/metaphlan
网友评论