写在前面
现在是 08:42,上午,还有30分钟就要赶去暑期培训会场(广西南宁-含线上场),想着今天应该一天都挺忙,干脆这会简单写一个昨晚碰到的用户的有趣问题。
不要拿 BLAST 结果就开始筛同源基因
一般来说,当我们知道某个模式生物或者已报道论文中某个基因与我们感兴趣的性状相关,那么我们会直接拿这个基因的序列,比对到我们感兴趣物种的序列上,然后看看到底比对上的是啥,随后就吭哧吭哧开始干。
这个时候,我们用的是 BLAST 进行比对。比对结果大体如下

那么这个时候怎么办?最naive的就是选择第一个,然后开始验证?
当然不是,为什么? 因为这四个可能都是目标基因,相比于参考序列所在物种来说,很可能在我们感兴趣的物种里面这个基因发生了多次复制,也就是扩张了。如果我们只选第一个比对结果,敲除了会如何?没有表型.... 因为扩张的分支常常有功能冗余。这样可能干了一年也没结果。
那如何处理?肯定使用 TBtools 的 Find the Best Homologies

默认情况下,敏感度是 5 ,得到下述结果

这说明什么,说明存在明显扩张.....至少是拷贝了4份,大概率是5份。如果是这种情况,我们提高敏感度

得到下述结果

如此,就非常清晰。
- 保守来说,那么是复制了 3 份
- 从宽泛一点来说,是 3+4,还有一个旁系分支,可能功能并没有变化,但无法确定
接下来如何?肯定是直接看转录组或者其他支持证据。
于是,一次最好是直接看 3 个或者 7 个,而不是像 BLAST 一样,可能只看第一个分值最高的,容易误入歧途。
写在最后
不错,Find the Best Homologies 一直给我们惊喜。而现在是 08:55,走人。
网友评论