美文网首页基因注释/富集分析与功能分类RR语言训练
又是神器!基于单基因批量相关性分析的GSEA

又是神器!基于单基因批量相关性分析的GSEA

作者: 9d760c7ce737 | 来源:发表于2019-07-21 20:24 被阅读292次

有这样的使用场景么?

1.已经确定研究的基因,但是想探索他潜在的功能,可以通过跟这个基因表达最相关的基因来反推他的功能,这种方法在英语中称为guilt of association,协同犯罪。
2.我们的注释方法依赖于TCGA大样本,既然他可以注释基因,那么任何跟肿瘤相关的基因都可以被注释,包括长链非编码RNA。

这个方法以前阐述过:
单基因批量相关性分析的妙用

但是这个方法有个小缺陷,并不知道最后富集的通路是正向影响还是反向影响,也就是无法判断方向。判断方向的工具也不是没有,GSEA就是一个。所以,我想能不能把批量相关性分析和GSEA结合起来。

GSEA需要的gene set是现成的没有问题,但是genelist没有,这里我们可以把所有基因跟单个基因的相关性系数当做LogFC,有正有负,就解决了geneList的问题。这个想法不是我的,是我的一个学员的,不过他要解决的是microRNA把基因的问题。

下面来实战一下:

1.首先加载数据

这个数据是我下载了TPM数据,然后提取出乳腺癌的数据得来的。

load(file = "BRCA_mRNA_exprSet.Rdata")
exprSet <- mRNA_exprSet
test <- exprSet[1:10,1:10]

2.写一个函数批量计算相关性

这个函数只要输入一个基因,他就会批量计算这个基因跟其他编码基因的相关性,返回相关性系数和p值。

batch_cor <- function(gene){
  y <- as.numeric(exprSet[gene,])
  rownames <- rownames(exprSet)
  do.call(rbind,future_lapply(rownames, function(x){
    dd  <- cor.test(as.numeric(exprSet[x,]),y,type="spearman")
    data.frame(gene=gene,mRNAs=x,cor=dd$estimate,p.value=dd$p.value )
  }))
}

3.并行化运行函数

PCDC1这个基因为例

library(future.apply)
plan(multiprocess)
system.time(dd <- batch_cor("PDCD1"))

这是返回的结果


4.制作genelist

gene <- dd$mRNAs
## 转换
library(clusterProfiler)
gene = bitr(gene, fromType="SYMBOL", toType="ENTREZID", OrgDb="org.Hs.eg.db")
## 去重
gene <- dplyr::distinct(gene,SYMBOL,.keep_all=TRUE)

gene_df <- data.frame(logFC=dd$cor,
                      SYMBOL = dd$mRNAs)
gene_df <- merge(gene_df,gene,by="SYMBOL")

## geneList 三部曲
## 1.获取基因logFC
geneList <- gene_df$logFC
## 2.命名
names(geneList) = gene_df$ENTREZID
## 3.排序很重要
geneList = sort(geneList, decreasing = TRUE)

5.运行GSEA分析

library(clusterProfiler)
## 读入hallmarks gene set,从哪来?
hallmarks <- read.gmt("h.all.v6.2.entrez.gmt")
# 需要网络
y <- GSEA(geneList,TERM2GENE =hallmarks)

作图看整体分布

### 看整体分布
library(ggplot2)
dotplot(y,showCategory=12,split=".sign")+facet_grid(~.sign)

本次结果中全是激活的


6.特定通路作图

yd <- data.frame(y)
library(enrichplot)
gseaplot2(y,"HALLMARK_INTERFERON_ALPHA_RESPONSE",color = "red",pvalue_table = T)

PCDC1跟阿拉法干扰素正相关,这个事情没什么好说的吧。

好了,我们又掌握了一个特别强悍,实用的技能。我是果子,明天见。

相关文章

  • 多个基因的相关性如何分析与展示?

    关于批量相关性分析,我们发过两个帖子。单基因批量相关性分析的妙用又是神器!基于单基因批量相关性分析的GSEA 两两...

  • 又是神器!基于单基因批量相关性分析的GSEA

    有这样的使用场景么? 1.已经确定研究的基因,但是想探索他潜在的功能,可以通过跟这个基因表达最相关的基因来反推他的...

  • GEO数据分析之GSEA

    GSEA-analysis 1.加载数据 载入前一步分析得到的表达矩阵 2.批量相关性分析 将第一行目的基因跟其他...

  • 专题:富集分析

    GSEA基因集富集分析 1、用clusterProfiler做GSEA - 简书 2、GSEA-基因集富集分析 -...

  • GASE相关知识(Linux)

    (Gene Set Enrichment Analysis,GSEA) GSEA概念: GSEA:(基因集富集分析...

  • RNA 20. SCI 文章中单样本免疫浸润分析 (ssGSEA

    这期讲讲单样本基因富集分析,这个也蛮有意思的之前我已经介绍过基因集富集分析(GSEA),但是当时是用差异基因来分析...

  • 2022-04-17

    GSEA缩写 GSEA的全称是Gene Set Enrichment Analysis, 中文翻译就是基因富集分析...

  • GSEA分析

    得到表达矩阵后最经典的分析就是GSEA:看看基因全局表达量的变化是否有某些特定的基因集合的倾向性。 GSEA分析合...

  • GSEA笔记

    GSEA缩写 GSEA的全称是Gene Set Enrichment Analysis,中文翻译就是基因集富集分析...

  • RNA 11. SCI 文章中基因表达富集之 GSEA

    前言 目前基于RNA做分析的文章中几乎都有 GSEA 的分析内容,并且都是出现在正文,那么这个也是表达基因筛选的一...

网友评论

    本文标题:又是神器!基于单基因批量相关性分析的GSEA

    本文链接:https://www.haomeiwen.com/subject/xqgslctx.html