MetaMLST是一种用于从宏基因组数据中进行多位点序列分型(Multilocus Sequence Typing, MLST)的工具。MLST是一种常用的细菌分型方法,通过比较多个保守的看家基因(housekeeping genes)的序列,来鉴定细菌的序列型(Sequence Type, ST)。MetaMLST允许直接从宏基因组数据中进行MLST分析,无需事先分离和培养细菌。
MetaMLST的主要功能和用法如下:
准备工作(Step 0)
克隆 MetaMLST 仓库(Step 1)
首先,需要从 GitHub 克隆 MetaMLST 仓库。这可以通过以下命令来完成:
git clone --recurse-submodules https://github.com/SegataLab/metamlst.git
cd metamlst
这将会创建一个名为 metamlst
的文件夹,并下载所有必要的子模块。
创建 Bowtie2 索引(Step 2)
接下来,通过默认的 MetaMLST 数据库创建 Bowtie2 索引,使用的命令如下:
metamlst-index.py -i bowtie_index
这里 bowtie_index
是你希望创建的索引名称。
映射 FASTQ 文件(Step 3)
使用上一步创建的索引来映射FASTQ 文件。这可以通过以下命令完成:
bowtie2 --very-sensitive-local -a --no-unal -x bowtie_index -U YOUR_READS.FASTQ | samtools view -bS - > YOUR_ALIGNMENTS.bam
将 YOUR_READS.FASTQ
替换成实际 FASTQ 文件名。这将生成一个名为 YOUR_ALIGNMENTS.bam
的 BAM 文件。
运行 MetaMLST(Step 4)
使用以下命令运行 MetaMLST:
metamlst.py YOUR_ALIGNMENTS.bam
将 YOUR_ALIGNMENTS.bam
替换成你的实际 BAM 文件名。结果将被保存在 ./out
文件夹中。如果有多个样本,需要对每个样本重复步骤 3 和 4。
合并 MetaMLST 结果(Step 5)
最后,使用以下命令合并所有通过 metamlst.py
生成的输出文件:
metamlst-merge.py ./out
合并后的结果将被保存在 ./out/merged
文件夹中。
以上步骤展示了如何使用 MetaMLST 工具来从宏基因组样本中进行 MLST 分析。
MetaMLST的优势在于可以直接从宏基因组数据中进行MLST分析,无需分离培养,适用于复杂的环境样本。但是,它的分析结果依赖于MLST数据库的完整性和准确性,对于一些新的或未知的菌种,可能无法给出准确的分型结果。
网友评论