差异分析③

作者: 柳叶刀与小鼠标 | 来源:发表于2018-05-28 15:42 被阅读3次
    • 统计差异基因数目
    tfit <- treat(vfit, lfc=1)
    dt <- decideTests(tfit)
    summary(dt)
            BasalvsLP BasalvsML LPvsML
    Down        1417      1512    203
    NotSig     11030     10895  13780
    Up          1718      1758    182
    

    一些研究需要不止一个调整后的p值cutoff值。 为了对重要性进行更严格的定义,可能需要log-fold-change(log-FC)超过最小值。 一般用来计算经验贝叶斯慢化t-统计的p值,并具有最小的log-FC要求。

    • 保存文件
    
    de.common <- which(dt[,1]!=0 & dt[,2]!=0)
    length(de.common)
    
    
    vennDiagram(dt[,1:2], circle.col=c("turquoise", "salmon"))
    write.fit(tfit, dt, file="results.txt")
    #使用topTreat输出差异基因信息
    #The top DE genes can be listed using topTreat for results using treat
    # (or topTable for results using eBayes). 
    #By default topTreat arranges genes from smallest to largest adjusted p-value with associated gene information, 
    #log-FC, average log-CPM, moderated t-statistic, 
    #raw and adjusted p-value for each gene. 
    #The number of top genes displayed can be specified, where n=Inf includes all genes. 
    basal.vs.lp <- topTreat(tfit, coef=1, n=Inf)
    basal.vs.ml <- topTreat(tfit, coef=2, n=Inf)
    head(basal.vs.lp)
    
    

    维恩图显示仅比较基础与仅LP(左),基础与仅ML(右)之间比较基因DE的数量,以及两个比较(中心)中DE的基因数目。 任何比较中不是DE的基因的数目标记在右下角。

    • 差异基因可视化

    为了总结目测所有基因的结果,可以使用plotMD函数生成显示来自线性模型的log-FC与平均对数-CPM值拟合的均值 - 差异图,其中突出显示差异表达的基因。

    plotMD(tfit, column=1, status=dt[,1],
           main=colnames(tfit)[1], 
           xlim=c(-8,13))
    
    • 使用Glimma生成交互式均值差分图。

    log-FC与log-CPM值显示在左侧面板中,与右侧面板中选定基因的每个样品的单个值相关。 结果表也显示在这些图下方,以及搜索栏以允许用户使用可用的注释信息来查找特定的基因。

    glMDPlot(tfit, coef=1, status=dt,
             main=colnames(tfit)[1],
             side.main="ENTREZID",
             counts=x$counts,
             groups=group, launch=T)
    
    • 热图

    使用来自gplots软件包的heatmap.2函数,从基础对比LP对比度的顶部100个DE基因(按调整的p值排列)创建热图。热图将样品按细胞类型正确聚类,并将基因重新排列成具有相似表达模式的区块。从热图中,我们观察到ML和LP样品的表达对于基础和LP之间的前100个DE基因非常相似。

    
    library(gplots)
    basal.vs.lp.topgenes <- basal.vs.lp$ENTREZID[1:100]
    i <- which(v$genes$ENTREZID %in% basal.vs.lp.topgenes)
    mycol <- colorpanel(1000,"blue","white","red")
    heatmap.2(v$E[i,], scale="row",
              labRow=v$genes$SYMBOL[i], labCol=group,
              col=mycol, trace="none", density.info="none", 
              margin=c(8,6), lhei=c(2,10), dendrogram="column")
    
    
    

    相关文章

      网友评论

        本文标题:差异分析③

        本文链接:https://www.haomeiwen.com/subject/dljgjftx.html