WGCNA
WGCNA(Weighted Gene Co-expression Network Analysis)是一种用于分析基因表达数据的工具,旨在识别基因之间的共表达模式并将它们组织成网络。这种方法可以用于发现与特定生物学过程相关联的基因模块,并且还可以帮助识别候选基因标记或生物标志物。
示例
library(tidyverse)
library(ggcor)
MEs <- net$MEs
colnames(MEs) <- str_remove(colnames(MEs), 'ME')
link_cor <- correlate(datTraits[,1:3],
MEs, cor.test = T, use = "p") %>%
as_cor_tbl() %>%
select(Traits = .row.names,
Modules = .col.names,
r, p.value) %>%
mutate(rd = cut(r, breaks = c(-Inf, 0.2, 0.4, Inf),
labels = c("< 0.2", "0.2 - 0.4", ">= 0.4")),
pd = cut(p.value, breaks = c(-Inf, 0.01, 0.05, Inf),
labels = c("< 0.01", "0.01 - 0.05", ">= 0.05")))
quickcor(MEs, type = "upper", cluster= T) +
geom_square() +
ggcor::anno_link(data = link_cor, aes(color = pd, size = rd)) +
scale_size_manual(values = c(0.5, 1, 2)) +
scale_colour_manual(values = c("#D95F02", "#1B9E77", "#A2A2A288"))
这段代码是用于进行 WGCNA(Weighted Gene Co-expression Network Analysis)模块与外部特征(Traits)之间的相关性分析,并将结果可视化的。
-
加载库:
-
tidyverse
:一个流行的数据处理和可视化工具包集合。 -
ggcor
:用于绘制相关性矩阵的库。
-
-
定义 MEs:这里假设
net$MEs
是模块特征的数据框。它包含了从 WGCNA 分析中获得的模块特征,每一列代表一个模块。 -
更改列名:移除模块特征名称中的 "ME" 前缀,并将结果赋值给
MEs
的列名。 -
计算特征与模块之间的相关性:
- 使用
correlate()
函数计算了特征数据框datTraits
的前三列与模块特征MEs
之间的相关性。 - 设置
cor.test = T
,以计算相关性的显著性检验。 - 使用
as_cor_tbl()
函数将结果转换为可操作的表格形式。 - 选择了特征名称、模块名称、相关系数 (
r
) 和 p 值 (p.value
) 列。
- 使用
-
创建
rd
和pd
列:- 使用
cut()
函数根据相关系数r
和 p 值p.value
分别创建了离散的标签。 -
rd
列将相关系数分成了三个范围,pd
列将 p 值分成了三个范围。
- 使用
-
绘制相关性图:
- 使用
quickcor()
函数绘制模块特征之间的相关性矩阵。 - 设置
type = "upper"
,表示只绘制相关性矩阵的上三角。 - 设置
cluster = T
,以对相关性矩阵进行聚类,以便更好地观察模块的相关性结构。 - 使用
geom_square()
函数添加正方形的几何对象。 - 使用
ggcor::anno_link()
函数添加相关性显著性的注释连接线,根据link_cor
数据框中的信息来着色和调整连接线的大小。 - 使用
scale_size_manual()
和scale_colour_manual()
函数手动设置连接线大小和颜色的映射。
- 使用
网友评论