又是神器！基于单基因批量相关性分析的GSEA

作者: 9d760c7ce737 | 来源:发表于2019-07-21 20:24 被阅读292次

多个基因的相关性如何分析与展示？
又是神器！基于单基因批量相关性分析的GSEA
GEO数据分析之GSEA
专题：富集分析
GASE相关知识（Linux）
RNA 20. SCI 文章中单样本免疫浸润分析（ssGSEA
2022-04-17
GSEA分析
GSEA笔记
RNA 11. SCI 文章中基因表达富集之 GSEA

有这样的使用场景么？

1.已经确定研究的基因，但是想探索他潜在的功能，可以通过跟这个基因表达最相关的基因来反推他的功能，这种方法在英语中称为guilt of association，协同犯罪。
2.我们的注释方法依赖于TCGA大样本，既然他可以注释基因，那么任何跟肿瘤相关的基因都可以被注释，包括长链非编码RNA。

这个方法以前阐述过：
单基因批量相关性分析的妙用

但是这个方法有个小缺陷，并不知道最后富集的通路是正向影响还是反向影响，也就是无法判断方向。判断方向的工具也不是没有，GSEA就是一个。所以，我想能不能把批量相关性分析和GSEA结合起来。

GSEA需要的gene set是现成的没有问题，但是genelist没有，这里我们可以把所有基因跟单个基因的相关性系数当做LogFC，有正有负，就解决了geneList的问题。这个想法不是我的，是我的一个学员的，不过他要解决的是microRNA把基因的问题。

下面来实战一下：

1.首先加载数据

这个数据是我下载了TPM数据，然后提取出乳腺癌的数据得来的。

load(file = "BRCA_mRNA_exprSet.Rdata")
exprSet <- mRNA_exprSet
test <- exprSet[1:10,1:10]

2.写一个函数批量计算相关性

这个函数只要输入一个基因，他就会批量计算这个基因跟其他编码基因的相关性，返回相关性系数和p值。

batch_cor <- function(gene){
  y <- as.numeric(exprSet[gene,])
  rownames <- rownames(exprSet)
  do.call(rbind,future_lapply(rownames, function(x){
    dd  <- cor.test(as.numeric(exprSet[x,]),y,type="spearman")
    data.frame(gene=gene,mRNAs=x,cor=dd$estimate,p.value=dd$p.value )
  }))
}

3.并行化运行函数

以PCDC1这个基因为例

library(future.apply)
plan(multiprocess)
system.time(dd <- batch_cor("PDCD1"))

这是返回的结果

4.制作genelist

gene <- dd$mRNAs
## 转换
library(clusterProfiler)
gene = bitr(gene, fromType="SYMBOL", toType="ENTREZID", OrgDb="org.Hs.eg.db")
## 去重
gene <- dplyr::distinct(gene,SYMBOL,.keep_all=TRUE)

gene_df <- data.frame(logFC=dd$cor,
                      SYMBOL = dd$mRNAs)
gene_df <- merge(gene_df,gene,by="SYMBOL")

## geneList 三部曲
## 1.获取基因logFC
geneList <- gene_df$logFC
## 2.命名
names(geneList) = gene_df$ENTREZID
## 3.排序很重要
geneList = sort(geneList, decreasing = TRUE)

5.运行GSEA分析

library(clusterProfiler)
## 读入hallmarks gene set，从哪来？
hallmarks <- read.gmt("h.all.v6.2.entrez.gmt")
# 需要网络
y <- GSEA(geneList,TERM2GENE =hallmarks)

作图看整体分布

### 看整体分布
library(ggplot2)
dotplot(y,showCategory=12,split=".sign")+facet_grid(~.sign)

本次结果中全是激活的

6.特定通路作图

yd <- data.frame(y)
library(enrichplot)
gseaplot2(y,"HALLMARK_INTERFERON_ALPHA_RESPONSE",color = "red",pvalue_table = T)

PCDC1跟阿拉法干扰素正相关，这个事情没什么好说的吧。

好了，我们又掌握了一个特别强悍，实用的技能。我是果子，明天见。

多个基因的相关性如何分析与展示？
关于批量相关性分析，我们发过两个帖子。单基因批量相关性分析的妙用又是神器！基于单基因批量相关性分析的GSEA 两两...
又是神器！基于单基因批量相关性分析的GSEA
有这样的使用场景么？ 1.已经确定研究的基因，但是想探索他潜在的功能，可以通过跟这个基因表达最相关的基因来反推他的...
GEO数据分析之GSEA
GSEA-analysis 1.加载数据载入前一步分析得到的表达矩阵 2.批量相关性分析将第一行目的基因跟其他...
专题：富集分析
GSEA基因集富集分析 1、用clusterProfiler做GSEA - 简书 2、GSEA-基因集富集分析 -...
GASE相关知识（Linux）
（Gene Set Enrichment Analysis，GSEA） GSEA概念： GSEA：(基因集富集分析...
RNA 20. SCI 文章中单样本免疫浸润分析（ssGSEA
这期讲讲单样本基因富集分析，这个也蛮有意思的之前我已经介绍过基因集富集分析（GSEA），但是当时是用差异基因来分析...
2022-04-17
GSEA缩写 GSEA的全称是Gene Set Enrichment Analysis, 中文翻译就是基因富集分析...
GSEA分析
得到表达矩阵后最经典的分析就是GSEA：看看基因全局表达量的变化是否有某些特定的基因集合的倾向性。 GSEA分析合...
GSEA笔记
GSEA缩写 GSEA的全称是Gene Set Enrichment Analysis，中文翻译就是基因集富集分析...
RNA 11. SCI 文章中基因表达富集之 GSEA
前言目前基于RNA做分析的文章中几乎都有 GSEA 的分析内容，并且都是出现在正文，那么这个也是表达基因筛选的一...

又是神器！基于单基因批量相关性分析的GSEA

有这样的使用场景么？

1.首先加载数据

2.写一个函数批量计算相关性

3.并行化运行函数

4.制作genelist

5.运行GSEA分析

6.特定通路作图

相关文章

多个基因的相关性如何分析与展示？

又是神器！基于单基因批量相关性分析的GSEA

GEO数据分析之GSEA

专题：富集分析

GASE相关知识（Linux）

RNA 20. SCI 文章中单样本免疫浸润分析（ssGSEA

2022-04-17

GSEA分析

GSEA笔记

RNA 11. SCI 文章中基因表达富集之 GSEA

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

基因注释/富集分析与功能分类

R

R语言训练

单细胞数据挖掘

科研信息学

生物信息学R语言源码