美文网首页
用R语言实现基因富集功能

用R语言实现基因富集功能

作者: expgene | 来源:发表于2023-09-19 11:13 被阅读0次

探序基因计算机工作室整理

1. 能实现基因富集功能的网站

MetascapeDAVIDKOBASGOEAST

参考:简书-Metascape 专门为生物学者设计的基因富集分析网站

知乎-去东方,最好用的在线GO富集分析工具

2. 安装R包

KEGG富集的时候转换基因标志要用到:org.Mm.eg.db、org.Hs.eg.db

BiocManager::install("clusterProfiler",ask=F,update=F)

BiocManager::install("org.Mm.eg.db",ask=F,update=F)

BiocManager::install("org.Hs.eg.db",ask=F,update=F)

如果用BiocManager::install方法安装比较慢的话,可以去bioconductor.org下载org.Hs.eg.db包源代码及相关依赖的包的代码,在服务器上用R CMD INSTALL xxx来安装。

3. 使用

案例1,给定基因做GO富集分析

library(org.Hs.eg.db)

library(clusterProfiler)

#基因存到一个向量中,然后转换成数字ID的形式

#idlist2为:"3604" "9452" "2115" "1493" "939" "3902" "56253"

id_list <- c("TNFRSF9","ITM2A","ETV1","CTLA4","CD27","LAG3","CRTAM")

idlist2 <- as.character(mapIds(org.Hs.eg.db,id_list,"ENTREZID","SYMBOL"))

go <- enrichGO(gene = idlist2, # Entrez ID列表

              OrgDb = org.Hs.eg.db, # 指定物种数据库

              keyType = "ENTREZID", # 指定给定的名称类型

              ont = "ALL", # 可选,BP(生物学过程)/CC(细胞组分)/MF(分子功能)/ALL(同时指定)

              pAdjustMethod = "BH", # P值校正方法,还可以是fdr

              pvalueCutoff = 0.05,qvalueCutoff = 0.2, # p/q值阈值

              readable = T # 将ID转换为symbol

)

#转换成数据框的形式,方便查看结果

go.res <- data.frame(go)

做KEGG富集分析

keggtab <- enrichKEGG(

gene = idlist2,  #基因列表文件中的基因名称

keyType = 'kegg',  #KEGG 富集

organism = 'hsa',  #例如,oas 代表绵羊,其它物种更改这行即可

 pAdjustMethod = 'fdr',  #指定 p 值校正方法

 pvalueCutoff = 0.05,  #指定 p 值阈值(可指定 1 以输出全部)

 qvalueCutoff = 0.2)  #指定 q 值阈值(可指定 1 以输出全部)

organism 参数中的物种名称列表在:https://www.genome.jp/kegg/catalog/org_list.html

但是作者在运行时,遇到错误:

Reading KEGG annotation online:

fail to download KEGG data...

Error in download.KEGG.Path(species) :

  'species' should be one of organisms listed in 'http://www.genome.jp/kegg/catalog/org_list.html'...

此外: Warning message:

In utils::download.file(url, quiet = quiet, method = "libcurl",  :

  URL 'https://rest.kegg.jp/link/hsa/pathway': status was 'Failure when receiving data from the peer'

------------------------------------------------------

参考:知乎-R语言进行富集分析及画图

简书-R包 clusterProfiler 比较不同dataset富集结果

4. 富集结果绘图

待补充

相关文章

  • 模式植物GO功能富集分析,背景基因制作教程

    前言 我们在做转录组数据分析时,大多数都会进行功能富集分析,预测目的基因所具有的的功能。富集工具常用到的R语言中c...

  • 本体论

    下面介绍一下基因功能富集分析的研究进展: 基因功能富集分析中的基因功能指的是众多代表一定的基因功能特征和生物过程的...

  • 基因功能富集方法和基因注释数据库介绍

    1. 两种基因功能富集方法介绍 名词解释:1. 基因功能富集分析:包括过表达分析ORA、功能分类打分FCS、基于同...

  • 转录组数据分析—clusterProfiler富集分析

    差异分析之后,为了了解我们获取的差异基因的功能及参与的生物学进程,我们需要对差异基因进行功能富集分析。基因富集分析...

  • ggplot2| 绘制KEGG气泡图

    对生信分析中得到的一些基因,进行KEGG富集分析,达到对基因进行注释和分类的目的。 本文利用R语言的ggplot2...

  • 专题:富集分析

    GSEA基因集富集分析 1、用clusterProfiler做GSEA - 简书 2、GSEA-基因集富集分析 -...

  • GO和KEGG学习笔记1(含R代码)

    材料:一个只有gene name的表格 需求:KEGG富集分析 背景 功能富集分析:按照功能分类,将功能相近的基因...

  • 基因富集分析

    基因功能富集分析中的基因功能指的是众多代表一定的基因功能特征和生物过程的基因功能集(gene set)。由这些基因...

  • ggplot2|绘制GO富集柱形图

    生信分析中经常会得到一些基因,然后做GO富集分析,达到对基因进行注释和分类的目的。 本文利用R语言的ggplot2...

  • GO富集分析(转载)

    GO富集介绍每个基因都会对应有一个或多个GO term(也就是GO功能)。富集涉及到两个概念:前景基因和背景基因。...

网友评论

      本文标题:用R语言实现基因富集功能

      本文链接:https://www.haomeiwen.com/subject/asynvdtx.html