美文网首页
批次效应分析

批次效应分析

作者: 小杜的生信筆記 | 来源:发表于2023-08-16 18:02 被阅读0次

写在前面

批次效应分析,在医学芯片研究中,使用不同芯片进行分析时常用的数据处理方式,但是很多同学处理后的数据,存在不满意的情况。因此,到处咨询,各种查教程。今天,使用简短的时间分享该数据处理教程。

最终分析结果

欢迎投稿

小杜一直在分享自己平时学习笔记,因此分享的内容大多数是与自己相关的,局限性比较大。我一直在倡导大家一起分享自己学习笔记或教程。分享内容不限于生信教程,可以是文章or文献遇到的问题及解决方案学习感悟等等。

小杜的生信笔记投稿窗口会一直开放,也欢迎大家投稿。


方法一、使用相关的云平台分析

很多医学类的云平台都有类似的小程序,只要你自己有那种想解决的意向。我自己不做医学类,因此,只是分享自己以前使用过的。

推荐平台:Sangerbox

http://sangerbox.com/home.html

提供了好几种方法,选择自己意向一种即可。



开发者也做的相关的软件使用介绍。



方法二、使用代码

此代码是社群中有个同学分享的,再此也分享给大家。仅供参考。

## 批次校正
#BiocManager::install("sva")
library('sva')
## 批次信息
batch = data.frame(sample = c(pd1$geo_accession,pd2$geo_accession),
                   batch = c(pd1$platform_id,pd2$platform_id))

## 未批次校正前PCA
#install.packages('FactoMineR')
#install.packages('factoextra')
library("FactoMineR")
library("factoextra")
pca.plot = function(dat,col){
  
  df.pca <- PCA(t(dat), graph = FALSE)
  fviz_pca_ind(df.pca,
               geom.ind = "point",
               col.ind = col ,
               addEllipses = TRUE,
               legend.title = "Groups"
  )
}
pca.plot(exp_idp,factor(batch$batch))
## sva 批次校正

combat_exp <- ComBat(dat = as.matrix(log2(exp_idp+1)),
                     batch = batch$batch)
pca.plot(combat_exp,factor(batch$batch))
combat_exp = data.frame(combat_exp)
save(combat_exp, eSet, file = "GSE70866.Rdata")

# 载入保存的数据
load("GSE70866.Rdata")
## 提取HYPOXIA相关基因表达矩阵
# BiocManager::install('GSEABase')
HYPOXIA = GSEABase::getGmt('HALLMARK_HYPOXIA.v7.5.1.gmt')
HYPOXIA_gene = HYPOXIA@.Data[[1]]@geneIds
exp_HYPOXIA = combat_exp[HYPOXIA_gene,]
exp_HYPOXIA = na.omit(exp_HYPOXIA)

## umap降维聚类分组
#devtools::install_github("ropenscilabs/umapr")
library(umapr)
umap_data = umap(t(exp_HYPOXIA))
umap_c = umap_data[,c('UMAP1','UMAP2')]

# K-Means聚类分析
fit1 <- kmeans(umap_c, 2) # 设定聚类个数为
group = fit1$cluster

umap_data$group = group
library(ggplot2)
ggplot(umap_data,aes(UMAP1,UMAP2,color = as.factor(group)))+
  geom_point()+
  theme_classic()+
  labs(color='group')
        

往期文章:

1. 最全WGCNA教程(替换数据即可出全部结果与图形)


2. 精美图形绘制教程

3. 转录组分析教程

小杜的生信筆記,主要发表或收录生物信息学的教程,以及基于R的分析和可视化(包括数据分析,图形绘制等);分享感兴趣的文献和学习资料!!

相关文章

网友评论

      本文标题:批次效应分析

      本文链接:https://www.haomeiwen.com/subject/qexlmdtx.html