用探针的表达量来反映基因的表达量。
知识点
1、GEO Datasets包括:
- 样本:以GSM开头
- 平台(手段):GPL,测序使用的芯片/平台
- 系列:GSE开头,一个完整的研究描述
GENE EXPRESSION OMNIBUS,是由NCBI创建并维护的基因表达数据库,里面的临床信息最多。
2、画热图时,注意让数据标准化,这样显示出的样本与样本之间的差异会更明显,数据的排列以每一列是一个样本,每一行是一个指标来进行,则scale(row)。
分析的基本流程
下载数据(表达矩阵、分组信息、探针与基因的对应关系)----初步的数据探索,看看数据是否可用(处理组与对照组之间是否有差异:PCA图、热图)----limma差异分析及可视化:拿到p值和logFC,做火山图、热图----富集分析KEGG、GO
网友评论