美文网首页生信相关
序列比对后计算变异位点,有效位点,核苷酸多样性

序列比对后计算变异位点,有效位点,核苷酸多样性

作者: 小明的数据分析笔记本 | 来源:发表于2018-10-20 20:40 被阅读0次
    • variable sites
    • informative sites
    • nucleotide diversity

    信息位点的定义:

    在两个及以上分类单元(的序列)中存在差异,且其中至少有两种变异类型在该位点出现两次及以上(虽然有了定义自己还是不太明白)
    摘自 高老师的系统发育分析完整教程

    三个名词的概念自己还不太理解,先把如何计算的过程记录下来,以论文 comparative analysis of six lagetstroemia complete chloroplast genome 中提到的六个紫薇属叶绿体基因组序列为例,使用mafft进行比对,然后计算上面三个指标(论文中的Table4)。
    使用之前提到的python脚本下载六种紫薇属植物的叶绿体基因组序列 简单的python脚本批量下载叶绿体基因组序列

    species accession number
    L.fauriei KT358807
    L.indica KX263727
    L.guilinensis KU885923
    L.indica “LüzhaoHongdie” KF572028
    L.subcostata KF572029
    L.speciosa KX572149
    第一种方法使用DNAsp软件

    1、点击file——open data file读入比对好的数据
    2、点击Data——format,依次选择haploid,chloroplast,点击OK

    3、点击 analysis——polymorphic sites,点击OK即可输出结果 30.PNG
    输出的结果包括位点总数(这里需要注意的是DnaSp这个软件计算的总位点数是去掉gap以后的)非变异位点;变异位点;singleton variable sites(这个不知道是什么意思);有效位点数(parsimony informative sites);计算出来的结果和文章中的Table4有些出入,暂时还没有想到原因
    4、点击analysis——DNA polymorphism 计算核苷酸多态性 32.PNG
    第二种方法使用IQ-tree

    IQ-tree是用来构建最大似然树(ML)的一款软件,阅读帮助文档时发现IQ-tree也可以用来计算有效位点的数量,使用到的参数

    iqtree -s example.phy -m JC -n 0 -alninfo
    
    -s 指定输入文件
    -m 指定模型
    -n 暂时不知道是什么作用 <#iterations> Fix number of iterations to stop (default: auto)
    -alninfo 将统计结果输出到 .alninfo 文件中 Print alignment site statistics to .alninfo file
    
    31.PNG

    结果和第一种方法也不太一样

    第三种方法使用在线程序https://indra.mullins.microbiol.washington.edu/DIVEIN/

    这种方法和第二种输出的结果是一致的

    相关文章

      网友评论

        本文标题:序列比对后计算变异位点,有效位点,核苷酸多样性

        本文链接:https://www.haomeiwen.com/subject/dsmmzftx.html