安装时间:2021.2.4
1. 简介
目前原核生物常用的分的界定标准有三种,包括基因组之间的平均氨基酸均一性(Average Nucleotide Identity, ANI),平均氨基酸均一性(Average Amino acid Identity, AAI),DNA杂交(DNA-DNA hybridization, DDH)。其中ANI作为种间判定的依据用的较多,同时,种间ANI的阈值根据不同的情况,在95%-96%之间波动,较多以95%为阈值。通常种间的界定阈值为DDH=70%,ANI=95%,AAI=95%。
2. fastANI
2.1 安装
conda install fastANI
2.2 使用
- 一对一的比对计算
fastANI -q genome1.fa -r genome2.fa -o output.txt
- 一对多的比对计算
fastANI -q genome1.fa --rl genome_list.txt -o output.txt
- 多对多的比对计算
fastANI --ql query.list --rl reference.list --matrix -o output.file -t 20
注意:query.list和reference.list文件内容为所比对基因组文件的名称,一个基因组名称独立成一行。
3. compareM
基因组之间的平均氨基酸的计算工具较少,同时其用于界定种间并不被普遍接受。
3.1 安装
conda create -n compareM python=3.6
conda activate python3.6
conda install comparem
3.2 使用
comparem aai_wf <input_files> <output_dir>
注意:
① input_files为包含基因组文件名称的文件,每个基因组文件名单独成行
② 文件名以.fa结尾
③ 包含基因组文件名的文件最后不能有空行
4. GGDC
- dDDH的计算暂时只找到一个网页版本的工具GGDC
- 该网页版本工具一次最多只能提交75个基因组序列
- 采用三种不同的计算公式,得出三种不同的结果。推荐采用第二种,因为公式2与基因组的长度无关。
网友评论