美文网首页Biostar Handbook学习小组
4.1 biostar第四课 gene ontology

4.1 biostar第四课 gene ontology

作者: bingli | 来源:发表于2017-11-13 04:23 被阅读30次

    Gene Ontology 解决两件事

    1. 注释,这个基因是啥
    2. 功能,这个基因干啥

    定义人类基因名的权威组织HUGO,我看到这里的时候一度怀疑这个组织有hugo boss做funder,纯属yy

    Sequence ontology SO,

    这个是解释我们平时看到的EST等等是啥个意思的。 一般来说只用 SO的term 而不用SO之间的relationship,
    获取SO信息

    URL=https://raw.githubusercontent.com/The-Sequence-Ontology/SO-Ontologies/master/so-simple.obo
    wget $URL
    

    注意 obo 格式是文本,且没有column

    某个序列的归属用 is_a 关键字

    目前总共2359个SO的term

    重头戏GO

    三大组分:细胞位置,分子功能(化学反应?),生物学功能(包含多步,一个化学反应完不成)
    要看基因组中功能注释最多的基因
    首先要获取两个文件,GO 和 GO association file

    #获取 GO
    wget http://purl.obolibrary.org/obo/go.obo
    
    #获取GAF
    wget http://geneontology.org/gene-associations/goa_human.gaf.gz
    

    这个文件是动态变化的,在不断的更新,所以GO分析的时候获取最新版本的GO就显得尤为重要

    GO分析套路

    ORA,这个应该是最常见的了

    相关文章

      网友评论

        本文标题:4.1 biostar第四课 gene ontology

        本文链接:https://www.haomeiwen.com/subject/sosapxtx.html