美文网首页肿瘤免疫数据挖掘生信分析
小鼠基因富集分析之任何通路

小鼠基因富集分析之任何通路

作者: 生信宝库 | 来源:发表于2021-01-20 14:47 被阅读0次

    今天忙里偷闲,自创了一套基于小鼠基因list的富集分析方法,主要原理是将之前用于人的基因富集分析方法搬运到小鼠上,大家可以各抒己见,在下方留言。

    那么,开始展示

    故事要从一个R包开始说起,在很久很久以前......我们做富集分析时除了人的基因可以直接使用常用的R包(clusterProfiler)其它物种还要自己下载参考数据集,非常费劲,直到它,她,他——msigdbr包的出现,彻底改变了这种僵局,我在简书上写了一篇关于这个包做GSEA的推文,网上最近出现了很多别的类似的介绍这个包的推文;我接下来就用一个小鼠基因list做一下各种GSEA通路的富集分析;

    1.准备基因集

    library(msigdbr)
    library(clusterProfiler)
    library(org.Mm.eg.db)
    library(DOSE)
    rm(list=ls())
    setwd("")
    gene <- read.table("gene.txt",sep = '\t',check.names = F )
    gene_symbols_vector <- as.vector(gene$V1)
    class(gene_symbols_vector)#这里必须是向量
    

    2.构建参考基因集

    #小鼠所有的基因集
    m_df = msigdbr(species = "Mus musculus")
    ##2.3 查看基因集类别:
    a <- m_df %>% dplyr::distinct(gs_cat, gs_subcat) %>% dplyr::arrange(gs_cat, gs_subcat)
    View(a)
    ##2.5 检索鼠类C2 (curated) CGP (chemical and genetic perturbations)基因集:
    m_df = msigdbr(species = "Mus musculus", category = "C2" )
    ##KEGG   
    m_df = msigdbr(species = "Mus musculus", category = "C2", subcategory = "CP:KEGG")
    #C5   GO:BP CC MF  HPO
    m_df = msigdbr(species = "Mus musculus", category = "C5")
    ##2.4 检索鼠类的hallmark 基因集:
    m_df = msigdbr(species = "Mus musculus", category = "H")
    ## 免疫相关通路,C7
    m_df = msigdbr(species = "Mus musculus", category = "C7")
    

    就说是不是很全乎,应有尽有,再也不用仅限制于GO,KEGG了

    3.输出富集分析结果

    msigdbr_t2g = m_df %>% dplyr::select(gs_name, gene_symbol) %>% as.data.frame()
    #head(gene_symbols_vector)
    locol<- enricher(gene = gene_symbols_vector, TERM2GENE = msigdbr_t2g, pvalueCutoff = 0.05,qvalueCutoff = 1)
    write.csv(locol,"locol.csv")
    

    下面就可以用这个输出的结果做气泡图,柱状图啦,啦,啦

    这里我就不放示例数据了,随便整点小鼠或别的基因集就能测试了,欢迎大家下方留言与我讨论交流。

    相关文章

      网友评论

        本文标题:小鼠基因富集分析之任何通路

        本文链接:https://www.haomeiwen.com/subject/nrjkzktx.html