写在前面
Emmm... 似乎发现自己的记忆力大不如前。类似的问题以前我在知识星球写过,不过现在确实没有太多去上面写。
TBtools最早期的两大主要功能,1)序列提取;2)GO分析,包括注释和富集分析。当我们对一个基因集合进行 GO 分析的时候,往往可能会遇到一个问题。即,GO 注释结果过于分散和复杂。于是存在 GO slim。
GO slim
一般情况下,我们在做GO分析的时候会使用

但是这个文件中,其实包含的信息比较庞大,如:
- 人类神经发育相关的注释,但是...如果你做植物,那么肯定植物又没神经?
- 植物花粉发育相关的,但是....如果你做动物,那么动物哪里有花粉?
。。。
于是GO slim就有了存在的理由。这事实上就是一堆又一堆的人对已有GO数据库进行相对特异性的注释标注,如存在

打开其中的注释信息可以看到

授粉,果然就是植物的。
但是问题来了,

只有 98个 Term!是的,如果用这个文件去做分析,那么你当然可以得到只属于植物的GO注释结果。然而事实是,如果生物体再简单,也简单不到98个Term就可以覆盖。
回头再看 go-basic.obo

有 40000+ 个... 如果看看里面的 GOslim 信息。

确实只有98个....
OK,那么缺少的是啥?
GO slim 缺少了很多生物体通用的Term
我的课题比较诡异,会涉及到减数分裂....如果我们用减数分类来搜索,会发现

找不到.... 而在 go-basic.obo中

写在最后
于是....我一般还是建议....用全面的,分析出来之后,自己爱怎么过滤就按照自己的心情来。
网友评论