Possvm安装:
conda envcreate -n possvm --file environment.yaml
condaactivate possvm
不要自己安装,因为有好多的依赖包
Possvm:充分利用Species overlap算法来解析系统发育关系和鉴定同源基因对,然后利用Mcl进行Orthologous groups的鉴定
输入文件:仅需要一个Newick形式的基因树文件-基因名的前缀要加上物种名
Possvm思想四步走:
*Possvm* works infour basic steps:
1. Identification oforthology pairs using Species Overlap, which are used to build an orthologygraph.
2. Obtain orthologyclusters from pairwise orthology relationships, using MCL clustering.
3. Produce parseabletables with orthogroups and ortholog pairs.
4. Orthogroups canbe annotated using names from reference member genes, in a phylogeny-awaremanner.
基因树文件有没有支持信息都可以
Possvm的各个参数:
-i:系统发育树的newick格式
-o:输出文件夹
-p:输出文件名称的前缀
-s:species overlap域值,float类型;默认为0,最大值为1,值越大同源群的包容性就越大
-method:聚类方法;包括:mcl(默认)、mclw(mcl weighted by node support)、louvain或lpa(label propagation algotithm)-经实践该参数设定在0.7-0.9之间,即0.8较为合适(纯属个人经验)
-outgroup:定义一系列的物种集合,这些物种在系统发育关系中被作为外类群。物种间可以用逗号分割,或者是一行一个物种。该选项不影响树的置根,仅用于orthology聚类。默认是禁用的。
-split:基因名包括物种名+基因名,该参数指定物种名和基因名的分割符合,如_,默认是_
-itermidroot:整数;打开重叠中点置根法,被用于代替默认的中点置根法。推荐该参数设为10
-skiproot:布尔值;关闭对树置根,在这种情况下一般是你的树已经有根
-printallpairs:布尔值;对整个系统发育关系中的所有基因的直系同源对/旁系同源对进行输出,默认只report那些直系同源对
-min_support_node:浮点数;Min node support toconsider orthology relationships. If not set, all relationships are considered.
-spstree:物种树的路径;如果物种树被提供,possvm将会使用物种树调和算法而不是物种重叠算法
Possvm运行(在该软件中我认为-s参数的设定对于OG大小比较关键):
Conda activatepossvm
激活conda环境后,使用test下面的数据进行测试:
$possvm -i test/fa_synthases.newick -p 1_1
网友评论