有时候会有这样的分析需求,拿到两个基因,或者两个基因list,虽然它们是不同的基因的,但是可以提一个问题,它们之间的功能注释上有没有相似性呢?
特别是,我以前比较两个基因List,只是看它们之间有多少overlap,如果overlap小,则说明这两个gene list很不一样。但是实际上并不是这样的。有可能这两个gene list中的基因是有着相似的功能,只不过是gene ID不相同罢了。这时候,GOsemsim包就派上用场了。
GOsemsim: semantic similarity measurement based on Gene ontology,也就是用基因注释的方法来分析不同的基因或者基因list的相似性。
主要函数如下:
-
goSim
andmgoSim
Calculate semantic similarity between two GO terms and two sets of GO terms -
geneSim
andmgeneSim
Calculate semantic similarity between two gene products and among multiple gene products -
clusterSim
andmclusterSim
Semantic similarity between two gene lists and multiple gene lists
下次再比较不同gene或者gene list的时候,就可以用这个包试试,算出的值越倾向于1,则表明这两个gene list或者gene越相似。
网友评论