美文网首页
Newick Subtree | 获取目标物种树,快速从已发表进

Newick Subtree | 获取目标物种树,快速从已发表进

作者: 生信石头 | 来源:发表于2023-07-03 17:59 被阅读0次

    写在前面

    过两天,我即回贵阳陪家人( = 换个地方加班)。收到支持 TBtools 开发的老友发来一个 feature request。大体是前述我写了一个 notung 界面化插件,可以用于分析「基因在物种演化尺度上的获得与丢失」。这个插件,需要一个「物种树」。自然,我想起来的是,直接使用早前提到的 「基于物种科学双名直接重构进化树」。但这个功能似乎不够完善。于是有了今天的推文。

    实际场景

    首先,我们计划拿到下述列表对应的物种树

    Hevea_brasiliensis
    Populus_trichocarpa
    Fragaria_vesca
    Prunus_persica
    Cucumis_sativus
    Phaseolus_vulgaris
    Lotus_japonicus
    Cicer_arietinum
    Medicago_truncatula
    Glycine_max
    Arabidopsis_thaliana
    Theobroma_cacao
    Vitis_vinifera
    Physalis_pubescens
    Oryza_sativa
    Zea_mays
    Setaria_italic
    Brachypodium_distachyon
    Aegilops_tauschii
    Triticum_urartu
    Sorghum_bicolor
    Lycoris_radiate
    Hyacinthus_orientalis
    

    于是我用 TBtools 早前功能,



    结果如下,很多节点没有拆开,因为之前的方法主要基于界门纲目科,到了属水平,没有分清楚亲缘关系。



    于是,我们需要另外想一个办法。

    直接从公开发表的大型物种树提取


    前述,李德铢老师课题组发表了一个基于质体基因组的超大型物种树。可以用起来。因为物种树放在 figshare 网站,我让网络环境比较好的朋友帮忙下载下来,得到结果如下。



    逻辑上,从这个超级大树提取即可。由于这个树是基于保守质体基因构建的,每个物种可能纳入了多个片段,所以ID上比较复杂。为此,我优化了「Newick Subtree」功能,做了相应支持,于是现在可以这样。



    会看到报错信息,意思是找不到 node。设置左下角 Contain Mode 参数。

    写在最后

    Emmm,怎么说呢。出来的进化树,枝长或许不是非常妥当,毕竟是子树。不过树结构是没问题的,逻辑上,用于「基因在物种演化尺度上的获得与丢失」完全足够。

    相关文章

      网友评论

          本文标题:Newick Subtree | 获取目标物种树,快速从已发表进

          本文链接:https://www.haomeiwen.com/subject/xnjtudtx.html