写在前面
那天夏老师突然给我了一个电话,大体是提了这么一个想法,亦即,「BLAST Zone」挺好的,但如果可以加上「One Step ML Tree」似乎就更好了。当然,这个事情其实不是没想过。主要还是涉及到一个多库检索,路径解决以及一些调整起来相对麻烦的事情。
于是也就不了了之了。不过,今晚我还是花了时间,把这个功能实现了。至于为什么?因为心情确实不好,今天一天心情都不怎样。来来去去,也只能谢谢代码来放松下子了。
回到主题,其实,这个功能,似乎不需要说明。
BLAST+建树

随后,等就完事了。注意到,其中可以指定使用 BLAST 结果的前多少个序列拿来建树,大体如下

多条序列
当然,我们可以输入多条序列,BLAST 然后建树。需要注意的是,重复的 HIT ID 当然会被去冗余。这个或许可以拿来简单看看输入的两个序列是不是在一个家族的同一小分支?当然我没想过要做多复杂的情况,毕竟有时候我们要考虑总序列如果太多,建树会慢了点。

多个数据库
如果只是一个BLAST数据库,那么其实平平无奇。有时候,我们是希望知道一个基因在多个物种中的同源基因是哪些,然后我们建个树,看看情况。

这里我们同时选择了拟南芥和水稻两个蛋白序列库,等到BLAST结果。注意到,实现逻辑是,每个库分别BLAST,然后整合比对结果。于是 Top 10 就会变成水稻 10 个 ,拟南芥 10 个。弹出的图稿如下

当然,有时候,我觉得其实如果输入一个基因,那么对应出来 Top 5 就差不多了,不需要 Top 10。
突然想起来,大家都在说 荔枝的 SVP 扩张了。然后呢,NG文稿也说了。那么其实我们可以看看的。随便到 TAIR 上找了一个 SVP,也不知道是不是就是,反正不管了。

然后,我们可以得到这棵树

果然,还是扩张了。从基因ID来看,是一串 SVP。
写在最后
Emmm,好,也到了下班时间了。今晚算是摸鱼了两个多小时。
网友评论