美文网首页R语言
用topGO进行GO富集分析

用topGO进行GO富集分析

作者: 咸鱼426 | 来源:发表于2019-11-21 17:51 被阅读0次

topGO是一个半自动的GO富集包,该包的主要优势是集中了好几种统计检验的方法,目前支持的统计方法如下:


一、安装

BiocManager::install('topGO')
需要R的版本为>=2.10,但biocmanager安装需要的R版本更高,现在应该是3.6。

二、数据准备

富集工作主要包括3个步骤:
1、准备相关数据;
2、进行富集统计检验;
3、分析结果。
所以最重要的工作就是数据的准备。需要的数据包括包含全部geneID(背景基因名,一般是研究物种的全部基因)的文件,需要进行富集分析的geneID(差异表达基因或感兴趣的基因)文件,还有gene-to-GO的注释文件。

物种全部的geneID和差异基因ID比较容易获得,比较费劲的是gene-to-GO文件。
topGO提供了一些函数来帮助我们自动获取注释信息:
annFUN.db:用于Bioconductor上有注释包的物种的芯片数据;
annFUN.org:用于Bioconductor上有“org.XX.XX”注释包的数据;
annFUN.gene2GO:用户自己提供gene-to-GO文件;
annFUN.GO2gene:用户提供的GO-to-gene文件也可以;
annFUN.file:读取有gene2GO或GO2gene的txt文件。
一般Bioconductor提供的注释物种并不多,我的方法主要是用AnnotationHub的select函数或biomaRt的getBM函数来获取,具体操作见:https://github.com/xianyu426/gene_annotation

自己提供gene2GO文件时,格式应该为:
gene_ID<TAB>GO_ID1, GO_ID2, GO_ID3, ....

三、数据导入

library(topGO)
# 读取gene-to-GO mapping文件
gene2go <- readMapping(file = "gene-to-GO文件") # 这里我用的是物种全部的基因对应GO文件
# 读取差异基因文件
DEGs <- read.table("差异基因文件", header = TRUE)

# 定义背景基因和感兴趣基因
genenames <- names(gene2go)
genelist <- factor(as.integer(genenames %in% DEGs$geneid)) 
# 这里会生成一个factor,有两个levels:0和1,其中1表示感兴趣的基因。
names(genelist) <- genenames
GOdata <- new("topGOdata", ontology="MF", allGenes = genelist, 
              annot = annFUN.gene2GO, gene2GO = gene2go)

这样就定义了一个topGOdata对象。

四、统计检验

test.stat <- new("classicCount", testStatistic = GOFisherTest, name = "Fisher test")
resultFisher <- getSigGroups(GOdat, test.stat)
test.stat <- new("elimScore", testStatistic = GOKSTest, name = "Fisher test", cutOff = 0.01)
resultElim <- getSigGroups(GOdata, test.stat)
test.stat <- new("weightCount", testStatistic = GOFisherTest, name="Fisher test", sigRatio = "ratio")
resultWeight <- getSigGroups(GOdata, test.stat)
test.stat <- new("classicScore", testStatistic = GOKSTest, name = "KS tests")
resultKS <- getSigGroups(GOdata, test.stat)
elim.ks <- runTest(GOdata, algorithm = "elim", statistic = "ks")
allRes <- GenTable(GOdat, classic=elim.ks, KS=resultKS, weight = resultWeight,
                   orderBy = "weight", ranksOf = "classic", topNodes =10)
write.table(allRes, file = "sig_GO_result.txt",
            row.name = FALSE, col.names=TRUE)

结果可以作气泡富集图。

五、显示结果

showSigOfNodes(GOdata, score(resultWeight), firstSigNodes = 10, useInfo = "all")

相关文章

  • 用topGO进行GO富集分析

    topGO是一个半自动的GO富集包,该包的主要优势是集中了好几种统计检验的方法,目前支持的统计方法如下: 一、安装...

  • 使用topGO进行GO富集分析

    欢迎关注”生信修炼手册”! topGO是一个专门用于做GO富集分析的R包,它默认从GO.db中读取GO的分类和结构...

  • GO富集之topGO

    topGO手册中的实例实现 手册地址:http://bioconductor.uib.no/2.7/bioc/vi...

  • R中使用topGO进行富集分析

    已知文件如下 DEG.list #差异基因list rice.map #物种注释到GO数据库的信息 一般只用到...

  • GO富集分析简单介绍

    GO富集分析原理简介和DAVID的GO富集分析方法操作演示 寻找差异表达的基因并挖掘它们可能的功能,是我们进行RN...

  • 【R画图学习3.1】富集气泡图

    做生信中,最常做的一个工作就是富集分析,例如GO/Pathway富集分析等,而GO/Pathway分析富集的结果目...

  • 15.KEGG富集分析R语言代码及5种图的绘制

    一、举例回顾 本节所使用GSE1009数据集,已经用limma包进行差异分析,现对DEGs做GO富集分析。 GSE...

  • miRNA功能富集分析

    相信大家都做过基因的功能富集分析,小编前面也花了不少篇幅给大家介绍GO和KEGG富集分析 ☞GO和KEGG富集分析...

  • TopGO出图的简易方法

    GO富集出来的结果可以非常多,如果没有一个层级显示,将会非常眼花缭乱。TopGO则通过DAG(Directed a...

  • ggplot2绘制GO富集分析柱状图

    1.使用clusterProfiler包进行GO富集分析使用clusterProfiler的enrichGO函数来...

网友评论

    本文标题:用topGO进行GO富集分析

    本文链接:https://www.haomeiwen.com/subject/jdftwctx.html