存储在Gene Expression Omnibus(GEO)和Sequence Read Archive(SRA)中的大量RNA-seq数据仍然是生物医学研究中未充分利用的资源。为了消除重用这些数据的技术障碍,我们开发了一个网络应用GREIN(GEO RNA-seq实验交互式导航器),它提供了用户友好的界面来操作和分析GEO RNA-seq数据。GREIN由后端计算管道提供支持,用于统一处理RNA-seq数据和大量(> 6,500)已处理的数据集。前端用户界面提供丰富的用户分析选项,包括子设置和下载处理数据,交互式可视化,统计功效分析,差异基因表达签名的构建及其全面的功能表征,和LINCS L1000数据的连通性分析。由用户友好界面驱动的大量后端数据和前端分析选项的结合使GREIN成为重用GEO RNA-seq数据的独特开源资源。GREIN可通过以下方式访问:https://shiny.ilincs.org/grein。
所有这些资源都提供了对处理过的RNA-seq数据的访问,但是大多数资源都不提供交互式界面来进一步操作和分析数据集;
GREP2的原理图工作流程,GREIN的Web界面和输出。使用GREP2管道系统地处理GEO数据集并将其存储在后端数据集库中。 GUI驱动的GREIN工作流程有助于对已处理数据集进行全面分析和可视化。
看看流程图,功能真是太强大了。
主要功能
GREIN中的探索性分析图。 (A)相关热图显示细胞系内的较高相关性和细胞系之间的低相关性。通常每个细胞系内的高相关性表明转录谱的高质量。 (B)基于中值绝对偏差的前500个最可变基因的Pearson相关性的分层聚类作为变异性度量。数据被标准化并以均值为中心。 (C)细胞系的三维主成分分析图。 (D)处理条件和细胞系的二维t-SNE图显示细胞系的清晰分离,然后RNA组分指示RNA-seq谱之间的可变性的两个主要来源。
用于评估非恶性MCF10A细胞系中转录变化的功效分析。 (A)基于单基因的功率估计,每组中不同数量的样本具有2的最小倍数变化和统计显着性α= 0.01。 (B)log2CPM-BCOV平面上的基因可检测性,FDR≤0.1,每组两个样品。
从ToppGene到iLINCS的一些重要途径和基因本体(GO)类别的快照。这些类别在使用DE和NDE和DT基因的组合列表在MCF10A细胞系中的缺氧和常氧之间进行比较中发现。红色垂直线是选定的0.05的截止值。
原创: 小伍说事 医知圈
网友评论