美文网首页Biostar Handbook学习小组
4.1 biostar第四课 gene ontology

4.1 biostar第四课 gene ontology

作者: bingli | 来源:发表于2017-11-13 04:23 被阅读30次

Gene Ontology 解决两件事

  1. 注释,这个基因是啥
  2. 功能,这个基因干啥

定义人类基因名的权威组织HUGO,我看到这里的时候一度怀疑这个组织有hugo boss做funder,纯属yy

Sequence ontology SO,

这个是解释我们平时看到的EST等等是啥个意思的。 一般来说只用 SO的term 而不用SO之间的relationship,
获取SO信息

URL=https://raw.githubusercontent.com/The-Sequence-Ontology/SO-Ontologies/master/so-simple.obo
wget $URL

注意 obo 格式是文本,且没有column

某个序列的归属用 is_a 关键字

目前总共2359个SO的term

重头戏GO

三大组分:细胞位置,分子功能(化学反应?),生物学功能(包含多步,一个化学反应完不成)
要看基因组中功能注释最多的基因
首先要获取两个文件,GO 和 GO association file

#获取 GO
wget http://purl.obolibrary.org/obo/go.obo

#获取GAF
wget http://geneontology.org/gene-associations/goa_human.gaf.gz

这个文件是动态变化的,在不断的更新,所以GO分析的时候获取最新版本的GO就显得尤为重要

GO分析套路

ORA,这个应该是最常见的了

相关文章

网友评论

    本文标题:4.1 biostar第四课 gene ontology

    本文链接:https://www.haomeiwen.com/subject/sosapxtx.html