美文网首页分析方法群体遗传学物种树构建
如何轻松构建物种系统发育树

如何轻松构建物种系统发育树

作者: Davey1220 | 来源:发表于2018-09-12 14:58 被阅读603次

在常规的基因组分析中,当我们对某一物种的基因组进行从头组装与注释获得其的基本信息后,通常会想知道该物种与一些其他近源物种之间的进化关系,此时就需要构建不同物种之间的系统发育树以探究该物种的进化地位。

我们这里将以不同物种之间保守的单拷贝核基因为基础,分别运用串联法(Concatenation)(先将不同物种之间的每个单拷贝基因单独进行多序列比对,然后将这些比对后的单拷贝基因进行首尾相连串接成一个supergene矩阵,最后将这个supergene用于构建系统发育树)和并联法(Coalescence)(先将不同物种之间的每个单拷贝基因单独进行多序列比对,并构建每一个单拷贝基因对应的基因树,然后将所有单拷贝基因对应的基因树进行合并重构出相应的物种树)进行ML系统发育树的构建。

准备文件:不同物种的蛋白序列文件: AT.fas  Bradi.fas  LOC_Os.fas  Potri.fas scaffold.fas  VIT.fas
所需软件:OrthoFinder, Mafft, TrimAI, RAxML, ASTRAL
所用脚本:EasySpeciesTree.py

1.使用OrthoFinder寻找不同物种之间的单拷贝基因

下载OrthoFinder程序包解压后即可使用(该软件需要依赖blast,mcl,fastme,fasttree等程序,需要提前安装好并添加到环境变量中,详细信息可查看软件的README文件)
查看软件帮助信息:./orthofinder -h

1.png

新建一个文件夹test,将所用物种的蛋白序列放入到该文件夹中
软件使用:./orthofinder -f test/ -S diamond
-f参数指定所用文件夹,默认使用blastp进行蛋白序列的比对,可加-S参数指定使用diamond程序进行比对(diamond需提前安装并添加到环境变量中,比对速度比blast快很多)
程序运行结束后会在test文件夹中生成一个Results文件,里面即为不同物种之间的Orthogroups和单拷贝基因等相关信息。

2.png

我们所需的单拷贝基因和对应的每个Orthogroups的具体信息在SingleCopyOrthogroups.txtOrthogroups.csv文件中。

3.png

2.使用EasySpeciesTree脚本进行物种系统发育树的构建

该脚本依赖Mafft, TrimAI, RAxML和ASTRAL程序,需要自己提前安装好
修改脚本中相应依赖程序的绝对路径:vim EasySpeciesTree.py

4.png

查看脚本帮助信息:python EasySpeciesTree.py -h
或添加脚本执行权限(chmod +x EasySpeciesTree.py)后运行./EasySpeciesTree.py -h

5.png

运行该脚本需要提供四个文件:所用物种基因名的缩写前缀文件,单拷贝基因文件SingleCopyOrthogroups.txt,所有物种的Orthogroups文件Orthogroups.csv,以及所有物种的蛋白序列合并后的文件all-pep.fas
合并所有物种的蛋白序列文件:for i in ls *.fas;do cat $i >>all-pep.fas;done
新建所有物种基因名的缩写前缀文件:vim species_id.txt

6.png

运行脚本构建物种系统发育树:nohup ~/EasySpeciesTree.py -in1 species_id.txt -in2 SingleCopyOrthogroups.txt -in3 Orthogroups.csv -in4 all-pep.fas -nb 10 -t 16 &
这里为了演示快速生成结果加上-nb参数设定bootstrap值为10,-t参数设定线程数为16,默认bootstrap值为100,thread值为10,氨基酸替换模型选择默认的PROTGAMMAJTT模型。
程序运行结束后会在当前路径下生成四个文件夹SingleGene,SingleGene_MSA,Concatenation,Coalescence,分别存放着所有单拷贝基因的序列,单拷贝基因比对后的序列,串联法建树的结果,并联法建树的结果。
详细运行过程可查看nohup.out文件中的日志信息。

7.png

Concatenataion文件夹中的RAxML_bipartitions.concatenation_out.nwk即为串联法最终生成的树文件

8.png

Coalescence文件夹中的Astral.coalescence_tree.nwk即为并联法最终生成的树文件

9.png

3.使用FigTree或MEGA进行可视化

将串联法和并联法生成的结果文件RAxML_bipartitions.concatenation_out.nwk,Astral.coalescence_tree.nwk导入FigTree中进行可视化

串联法FigTree可视化结果

10.png

并联法FigTree可视化结果

11.png

EasySpeciesTree程序下载链接:https://github.com/Davey1220/EasySpeciesTree.git
可用git clone https://github.com/Davey1220/EasySpeciesTree.git 直接下载使用。

12.png

相关文章

  • 如何轻松构建物种系统发育树

    在常规的基因组分析中,当我们对某一物种的基因组进行从头组装与注释获得其的基本信息后,通常会想知道该物种与一些其他近...

  • mcmctree估算物种分歧时间

    推断物种系统发育关系以及分歧时间对探讨物种起源与演化具有重要意义。通过最大似然法(ML)构建物种进化树以及估算物种...

  • 7.1 GWAS:系统进化树——MEGA

    系统发育树 系统发育树是表明被认为具有共同祖先的各物种/材料之间的演化关系树形图,用来描述物种(或材料、序列等)之...

  • 构建系统发育树

    系统发育树的构建 现有的方法 系统发育树构建方法的优劣 link 选择:一般情况下,若有合适的分子进化模型可供选择...

  • GWAS理论 1-3 群体结构与亲缘关系评估

    一. 群体结构评估 1.群体结构 群体结构评估内容构建系统发育树群体结构分析PCA(主成分分析) a.系统发育树 ...

  • 如何寻找同源基因---OrthoFinder

    构建物种的系统发育树,计算kaks值或者比较基因组学和进化的其他分析都少不了需要寻找同源基因。之前已经介绍过Ort...

  • 重测序分析(9)群体进化分析之构建进化树

    1.进化树的概念 系统发育或系统发育树,是物种间、基因间、群体间乃至个体间谱系关系的一种表现形式。Node:分支的...

  • 2022-05-31

    利用单拷贝基因构树利用orthofinder寻找单拷贝基因构建系统发育树 - Zhz Blog (zhouxiao...

  • 利用VCF文件构建系统发育树

    导读 本文将介绍三种使用VCF文件,构建系统发育树的方法,包括程序的安装,使用,已及系统发育树的可视化与美化。 1...

  • 代码积累

    计算机知识 $ vim ~/.bashrc 序列处理 构建系统发育树 本地比对 基因家族代码

网友评论

    本文标题:如何轻松构建物种系统发育树

    本文链接:https://www.haomeiwen.com/subject/hpmvgftx.html