美文网首页
5-【ANI、AAI、dDDH】的安装和使用(2021.2.4)

5-【ANI、AAI、dDDH】的安装和使用(2021.2.4)

作者: lkj666 | 来源:发表于2021-02-05 16:17 被阅读0次

    安装时间:2021.2.4


    1. 简介

    目前原核生物常用的分的界定标准有三种,包括基因组之间的平均氨基酸均一性(Average Nucleotide Identity, ANI),平均氨基酸均一性(Average Amino acid Identity, AAI),DNA杂交(DNA-DNA hybridization, DDH)。其中ANI作为种间判定的依据用的较多,同时,种间ANI的阈值根据不同的情况,在95%-96%之间波动,较多以95%为阈值。通常种间的界定阈值为DDH=70%,ANI=95%,AAI=95%。


    2. fastANI

    2.1 安装

    conda install fastANI
    

    2.2 使用

    1. 一对一的比对计算
    fastANI -q genome1.fa -r genome2.fa -o output.txt
    
    1. 一对多的比对计算
    fastANI -q genome1.fa --rl genome_list.txt -o output.txt
    
    1. 多对多的比对计算
     fastANI --ql query.list --rl reference.list --matrix -o output.file -t 20
    

    注意:query.list和reference.list文件内容为所比对基因组文件的名称,一个基因组名称独立成一行。


    3. compareM

    基因组之间的平均氨基酸的计算工具较少,同时其用于界定种间并不被普遍接受。

    3.1 安装

    conda create -n compareM python=3.6
    conda activate python3.6
    conda install comparem
    

    3.2 使用

    comparem aai_wf  <input_files>  <output_dir>
    

    注意:
    ① input_files为包含基因组文件名称的文件,每个基因组文件名单独成行
    ② 文件名以.fa结尾
    ③ 包含基因组文件名的文件最后不能有空行


    4. GGDC

    • dDDH的计算暂时只找到一个网页版本的工具GGDC
    1. 该网页版本工具一次最多只能提交75个基因组序列
    2. 采用三种不同的计算公式,得出三种不同的结果。推荐采用第二种,因为公式2与基因组的长度无关。

    相关文章

      网友评论

          本文标题:5-【ANI、AAI、dDDH】的安装和使用(2021.2.4)

          本文链接:https://www.haomeiwen.com/subject/misvtltx.html