🤒 simplifyEnrichment | 让我来做你的富集结

作者: 生信漫卷 | 来源:发表于2023-03-01 14:37 被阅读0次

让我来做你的眼吧
让我来做你的女超人
如果可以，让我来做你的眼
让我来做你的双眼 No．序
我来做你的腿
我来做你的读者
下辈子，让我来做你的狗
一城，两人，三餐，四季。
让我做你的眼
让我做你的大树

写在前面

最近真是烦心啊，事事不顺，找个日子我要找大师算一卦。😂

大家基本都会做富集分析，但有时候terms实在太多，读起来真是累，也搞不清到底谁是其中相对重要的。🥲

之前有一些R包通过计算基因集的overlap，进行term合并，效果也还可以。🥰

今天跟大家介绍的是simplifyEnrichment包，通过计算语义相似性矩阵来合并terms，效果也是要比计算基因overlap要好的多（这可不是我空口说的，这是原文比较的结果）。🤩

用到的包

library(tidyverse)
library(simplifyEnrichment)

示例数据

我们随便生成500个GO的term吧。

set.seed(111)
go_id <-  random_GO(500)
head(go_id)

给GO瘦个身

mat <-  GO_similarity(go_id, 
                      ont =  c("BP", "CC", "MF"),
                      db = 'org.Hs.eg.db',
                      measure = "Rel",
                      remove_orphan_terms = F)

计算相似性并可视化

df <-  simplifyGO(mat)

看看有多少个cluster。😏

head(df)
sort(table(df$cluster))

split函数，分开查看。🤓

split(df, df$cluster)

单纯聚类

如果你不需要出图，只要聚类，可以在simplifyGO()函数使用时将plot设置为F。

当然，你也可以使用binary_cut() 或cluster_terms()。🧐

binary_cut(mat)

cluster_terms(mat, method = "binary_cut")

给其他聚类结果瘦身

可以瘦身的不仅仅是GO的富集结果，你也可以使用其他的，下面一些函数补充给大家：👇

term_similarity_from_enrichResult();

term_similarity_from_KEGG();

term_similarity_from_Reactome();

term_similarity_from_MSigDB();

term_similarity_from_gmt();

多列表GO-ID的应用

我们经常会有好几个GO-ID的list，想要比较一下，找到有意义的terms，就需要用到simplifyGOFromMultipleLists()函数了。

8.1 创建模拟数据

这里我们用一下cola包的示例数据，生成3个list。🥳

library(cola)
data(golub_cola) 
res <-  golub_cola["ATC:skmeans"]

library(hu6800.db)
x <- hu6800ENTREZID
mapped_probes = mappedkeys(x)
id_mapping = unlist(as.list(x[mapped_probes]))

lt <- functional_enrichment(res, k = 3, id_mapping = id_mapping)

8.2 查看list名

names(lt)

8.3 查看数据

操作和常用的list操作是一样的。😚

head(lt[[1]][, 1:7])

8.4 比较一下并可视化

这里我们把padj_cutoff设置的小一点，以便节省时间。😏

simplifyGOFromMultipleLists(lt, padj_cutoff = 0.001)

8.5 其他格式

输入数据也可以是其他格式的，这里补充两个。👇

1️⃣

lt2 <- lapply(lt, function(x) structure(x$p.adjust, names = x$ID))

simplifyGOFromMultipleLists(lt2, padj_cutoff = 0.001)

2️⃣
simplifyGOFromMultipleLists的输入数据一般有3种类型：🤒

adjusted p-values的向量列表，以GO-ID为名；

data frame，包含go_id_column和padj_column列，

GO-ID的字符向量列表，每个字符向量将被改变为一个数字向量，所有的值都为1，原来的GO- IDs被用作向量的名称。

lt3 <- lapply(lt, function(x) x$ID[x$p.adjust < 0.001])
simplifyGOFromMultipleLists(lt3)

如何引用

📍
Gu Z, Hübschmann D. Simplify enrichment: A bioconductor package for clustering and visualizing functional enrichment results [published online ahead of print, 2022 Jun 6]. Genomics Proteomics Bioinformatics. 2022;S1672-0229(22)00073-0. doi:10.1016/j.gpb.2022.04.008

<center>最后祝大家早日不卷!~</center>

点个在看吧各位~ ✐.ɴɪᴄᴇ ᴅᴀʏ 〰

本文由mdnice多平台发布

网友评论

本文标题：🤒 simplifyEnrichment | 让我来做你的富集结

本文链接：https://www.haomeiwen.com/subject/njzrldtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

🤒 simplifyEnrichment | 让我来做你的富集结

写在前面

用到的包

示例数据

给GO瘦个身

计算相似性并可视化

单纯聚类

给其他聚类结果瘦身

多列表GO-ID的应用

8.1 创建模拟数据

8.2 查看list名

8.3 查看数据

8.4 比较一下并可视化

8.5 其他格式

如何引用

相关文章

让我来做你的眼吧

让我来做你的女超人

如果可以，让我来做你的眼

让我来做你的双眼 No．序

我来做你的腿

我来做你的读者

下辈子，让我来做你的狗

一城，两人，三餐，四季。

让我做你的眼

让我做你的大树

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

注释和富集

生信绘图