In molecular biology, STRING (Search Tool for the Retrieval of Interacting Genes/Proteins) is a biological database and web resource of known and predicted protein–protein interactions.(from Wkkipedia)
无论是用蛋白名字,氨基酸序列或者是基因名,都可以在STRING找到相应的蛋白并得出PPI。不仅如此,在PPI展示的页面还有关于PPI内蛋白/基因的GO/KEGG注释。 https://www.jianshu.com/p/77f5f50f6f2b
而在R中,也同样可以对基因进行KEGG/GO注释。那到底哪个更方便,更可信呢。
在R中如何进行注释,这里就不在多说。而在STRING上如何下载GO/KEGG注释信息在这里有介绍。https://www.jianshu.com/p/d0e5728ffed3
那我们就分别来对比下同样的基因,在STRING和R得到的KEGG/GO注释有啥区别。这里主要是比较STRING和R中的KEGG/GO的background gene库的大小。如果数据库太久或比较小,有很多基因就没有被收录进去,这样有可能我们的目的基因就不会被注释到。(GO注释包括BP,CC和MF)。
注意:在名为‘GeneRation’和‘BgRatio’两列的数据里,我们只看分子。
在KEGG注释方面,我们可以看到,各自的区别不大。
在GO注释方面,同样识别的基因和background区别也不大,所以在KEGG/GO功能注释中,两种方法大家都可以放心使用。
PS:
虽说大多说情况如此,既然可以在STRING这种online tools中做出来的东西,为何我要在R中敲代码来实现呢。
然后,我就发现了某些功能,STRING是很笼统的归为一类,而R中,则会进行比较细致的分类。在这,R中,可以通过p,q值进行cutoff ,而在STRING中,只能通过调节interaction srore来cutoff了。所以STRING几秒钟的便捷,和R中细腻还是有一点区别的,看大家所需吧。毕竟鱼与熊掌不可兼得。(但AJ和钢丝球可以)
网友评论