Gene Ontology 解决两件事
- 注释,这个基因是啥
- 功能,这个基因干啥
定义人类基因名的权威组织HUGO,我看到这里的时候一度怀疑这个组织有hugo boss做funder,纯属yy
Sequence ontology SO,
这个是解释我们平时看到的EST等等是啥个意思的。 一般来说只用 SO的term 而不用SO之间的relationship,
获取SO信息
URL=https://raw.githubusercontent.com/The-Sequence-Ontology/SO-Ontologies/master/so-simple.obo
wget $URL
注意 obo 格式是文本,且没有column
某个序列的归属用 is_a 关键字
目前总共2359个SO的term
重头戏GO
三大组分:细胞位置,分子功能(化学反应?),生物学功能(包含多步,一个化学反应完不成)
要看基因组中功能注释最多的基因
首先要获取两个文件,GO 和 GO association file
#获取 GO
wget http://purl.obolibrary.org/obo/go.obo
#获取GAF
wget http://geneontology.org/gene-associations/goa_human.gaf.gz
这个文件是动态变化的,在不断的更新,所以GO分析的时候获取最新版本的GO就显得尤为重要
GO分析套路
ORA,这个应该是最常见的了
网友评论