美文网首页
2023-02-27-Possvm一种基于系统发育树鉴定基因家族

2023-02-27-Possvm一种基于系统发育树鉴定基因家族

作者: Amant_8bb4 | 来源:发表于2023-02-26 15:55 被阅读0次

Possvm安装:

conda envcreate -n possvm --file environment.yaml

condaactivate possvm

不要自己安装,因为有好多的依赖包

Possvm:充分利用Species overlap算法来解析系统发育关系和鉴定同源基因对,然后利用Mcl进行Orthologous groups的鉴定

输入文件:仅需要一个Newick形式的基因树文件-基因名的前缀要加上物种名

Possvm思想四步走:

*Possvm* works infour basic steps:

1. Identification oforthology pairs using Species Overlap, which are used to build an orthologygraph.

2. Obtain orthologyclusters from pairwise orthology relationships, using MCL clustering.

3. Produce parseabletables with orthogroups and ortholog pairs.

4. Orthogroups canbe annotated using names from reference member genes, in a phylogeny-awaremanner.

基因树文件有没有支持信息都可以

Possvm的各个参数:

-i:系统发育树的newick格式

-o:输出文件夹

-p:输出文件名称的前缀

-sspecies overlap域值,float类型;默认为0,最大值为1,值越大同源群的包容性就越大

-method:聚类方法;包括:mcl(默认)、mclwmcl weighted by node support)、louvainlpalabel propagation algotithm-经实践该参数设定在0.7-0.9之间,即0.8较为合适(纯属个人经验)

-outgroup:定义一系列的物种集合,这些物种在系统发育关系中被作为外类群。物种间可以用逗号分割,或者是一行一个物种。该选项不影响树的置根,仅用于orthology聚类。默认是禁用的。

-split:基因名包括物种名+基因名,该参数指定物种名和基因名的分割符合,如_,默认是_

-itermidroot:整数;打开重叠中点置根法,被用于代替默认的中点置根法。推荐该参数设为10

-skiproot:布尔值;关闭对树置根,在这种情况下一般是你的树已经有根

-printallpairs:布尔值;对整个系统发育关系中的所有基因的直系同源对/旁系同源对进行输出,默认只report那些直系同源对

-min_support_node:浮点数;Min node support toconsider orthology relationships. If not set, all relationships are considered.

-spstree:物种树的路径;如果物种树被提供,possvm将会使用物种树调和算法而不是物种重叠算法

Possvm运行(在该软件中我认为-s参数的设定对于OG大小比较关键):

Conda activatepossvm

激活conda环境后,使用test下面的数据进行测试:

$possvm  -i test/fa_synthases.newick -p 1_1

相关文章

  • 练习:基因家族

    基因家族鉴定分析操作手册: 基因家族 基因家族鉴定 基因家族鉴定分析总结 1.下载基因组信息文件,gff,cds,...

  • 代码积累

    计算机知识 $ vim ~/.bashrc 序列处理 构建系统发育树 本地比对 基因家族代码

  • 基因家族分析三(构建基因家族系统发育树)

    一:NBS基因家族系统发育树 1. 将数据修改一下 在拟南芥基因家族分析(一)中我们已经将NBS的pep序列找到了...

  • 基因家族的鉴定-基于windows系统上的本地blast

    基因家族的鉴定-基于windows系统上的本地blast 基因组的序列提取,详情请看我之前的教程https://w...

  • 基因家族鉴定及分析

    单个基因家族分析方法基因家族鉴定及分析 | Wutianzhen (wu-tz.github.io)[https:...

  • 重测序分析(9)群体进化分析之构建进化树

    1.进化树的概念 系统发育或系统发育树,是物种间、基因间、群体间乃至个体间谱系关系的一种表现形式。Node:分支的...

  • 2022-05-31

    利用单拷贝基因构树利用orthofinder寻找单拷贝基因构建系统发育树 - Zhz Blog (zhouxiao...

  • 目录

    1.基因家族分析专题 • 基因家族概念• 数据库检索与成员鉴定• 蛋白成员基本特性和基因结构分析• ...

  • 基因家族分析(2)鉴定

    基因家族成员鉴定的主要方法为序列相似性比对和功能结构域预测。以苦荞的MAPK基因家族的鉴定为例。 苦荞基因组数据处...

  • 基因家族分析(4)ggtree绘制高端进化树

    系统发育树几乎是基因家族文章的必备图,一个好看的树图的确能给文章增色不少,一般的用户可能只使用MEGA绘图,进阶一...

网友评论

      本文标题:2023-02-27-Possvm一种基于系统发育树鉴定基因家族

      本文链接:https://www.haomeiwen.com/subject/idlcldtx.html