写在前面
过两天,我即回贵阳陪家人( = 换个地方加班)。收到支持 TBtools 开发的老友发来一个 feature request。大体是前述我写了一个 notung 界面化插件,可以用于分析「基因在物种演化尺度上的获得与丢失」。这个插件,需要一个「物种树」。自然,我想起来的是,直接使用早前提到的 「基于物种科学双名直接重构进化树」。但这个功能似乎不够完善。于是有了今天的推文。
实际场景
首先,我们计划拿到下述列表对应的物种树
Hevea_brasiliensis
Populus_trichocarpa
Fragaria_vesca
Prunus_persica
Cucumis_sativus
Phaseolus_vulgaris
Lotus_japonicus
Cicer_arietinum
Medicago_truncatula
Glycine_max
Arabidopsis_thaliana
Theobroma_cacao
Vitis_vinifera
Physalis_pubescens
Oryza_sativa
Zea_mays
Setaria_italic
Brachypodium_distachyon
Aegilops_tauschii
Triticum_urartu
Sorghum_bicolor
Lycoris_radiate
Hyacinthus_orientalis
于是我用 TBtools 早前功能,
结果如下,很多节点没有拆开,因为之前的方法主要基于界门纲目科,到了属水平,没有分清楚亲缘关系。
于是,我们需要另外想一个办法。
直接从公开发表的大型物种树提取
前述,李德铢老师课题组发表了一个基于质体基因组的超大型物种树。可以用起来。因为物种树放在 figshare 网站,我让网络环境比较好的朋友帮忙下载下来,得到结果如下。
逻辑上,从这个超级大树提取即可。由于这个树是基于保守质体基因构建的,每个物种可能纳入了多个片段,所以ID上比较复杂。为此,我优化了「Newick Subtree」功能,做了相应支持,于是现在可以这样。
会看到报错信息,意思是找不到 node。设置左下角 Contain Mode 参数。
写在最后
Emmm,怎么说呢。出来的进化树,枝长或许不是非常妥当,毕竟是子树。不过树结构是没问题的,逻辑上,用于「基因在物种演化尺度上的获得与丢失」完全足够。
网友评论