美文网首页
5-【ANI、AAI、dDDH】的安装和使用(2021.2.4)

5-【ANI、AAI、dDDH】的安装和使用(2021.2.4)

作者: lkj666 | 来源:发表于2021-02-05 16:17 被阅读0次

安装时间:2021.2.4


1. 简介

目前原核生物常用的分的界定标准有三种,包括基因组之间的平均氨基酸均一性(Average Nucleotide Identity, ANI),平均氨基酸均一性(Average Amino acid Identity, AAI),DNA杂交(DNA-DNA hybridization, DDH)。其中ANI作为种间判定的依据用的较多,同时,种间ANI的阈值根据不同的情况,在95%-96%之间波动,较多以95%为阈值。通常种间的界定阈值为DDH=70%,ANI=95%,AAI=95%。


2. fastANI

2.1 安装

conda install fastANI

2.2 使用

  1. 一对一的比对计算
fastANI -q genome1.fa -r genome2.fa -o output.txt
  1. 一对多的比对计算
fastANI -q genome1.fa --rl genome_list.txt -o output.txt
  1. 多对多的比对计算
 fastANI --ql query.list --rl reference.list --matrix -o output.file -t 20

注意:query.list和reference.list文件内容为所比对基因组文件的名称,一个基因组名称独立成一行。


3. compareM

基因组之间的平均氨基酸的计算工具较少,同时其用于界定种间并不被普遍接受。

3.1 安装

conda create -n compareM python=3.6
conda activate python3.6
conda install comparem

3.2 使用

comparem aai_wf  <input_files>  <output_dir>

注意:
① input_files为包含基因组文件名称的文件,每个基因组文件名单独成行
② 文件名以.fa结尾
③ 包含基因组文件名的文件最后不能有空行


4. GGDC

  • dDDH的计算暂时只找到一个网页版本的工具GGDC
  1. 该网页版本工具一次最多只能提交75个基因组序列
  2. 采用三种不同的计算公式,得出三种不同的结果。推荐采用第二种,因为公式2与基因组的长度无关。

相关文章

网友评论

      本文标题:5-【ANI、AAI、dDDH】的安装和使用(2021.2.4)

      本文链接:https://www.haomeiwen.com/subject/misvtltx.html