基础知识:
- GEO数据库架构介绍:https://www.jianshu.com/p/34b86d6953f3
- GEO数据库中platform信息详解:https://www.jianshu.com/p/39f0882e47f5
芯片数据处理(R语言):
- GEO数据如何方便地下载?
- 数据什么时候需要标准化?
- 什么时候做log转换?
- 芯片探针如何转换?
- 差异基因如何获得?
- 配对样本的对比矩阵如何构建?
- 配对样本如何作图展示?
- 热图火山图究竟在什么?
- GO分析,KEGG分析怎么做,如何解释?
主要参考部分:
- 1.GEOquery(R包)数据下载
- 6.探针转换与基因去重
- 7.差异分析(limma)
# 如果没有配对信息,差异分析做:
design=model.matrix(~ group_list)
fit=lmFit(exprSet,design)
fit=eBayes(fit)
allDiff=topTable(fit,adjust='fdr',coef="group_listafter",number=Inf,p.value=0.05)
# 有配对信息的,差异分析应该这样做:
pairinfo = factor(rep(1:18,2))
design=model.matrix(~ pairinfo+group_list)
fit=lmFit(exprSet,design)fit=eBayes(fit)
allDiff_pair=topTable(fit,adjust='BH',coef="group_listafter",number=Inf,p.value=0.05)
参考:
RNA-seq数据处理:
- 安装软件、新建conda python环境(包含部分Linux系统基础知识)
- 下载数据(sra文件)
- 数据过滤(去接头等)
- Fastqc质控
- Hisat2进行比对
- 计数
- R语言表达谱分析
网友评论