【批次效应】combat

【批次效应】combat

作者: jjjscuedu | 来源:发表于2021-11-27 12:47 被阅读0次

GEO芯片联合分析批次校正combat/limma
【批次效应】combat
sva_combat校正批次效应
sva ComBat去除GEO数据批次效应
批次效应（batch effects）
RNA-seq 转录组批次效应校正 combat代码
PH525x series - Simpson’s Parado
【单细胞测序】关于批次效应 batch effect
困扰的batch effect
刚入门时老师非要合并dataset时batch effect困扰

现在其实已经有很多处理批次效应的方法，有基本基于中心值和方差调整的，也有的利用神经网络，或者机器学习（例如cell-blast的生成对抗网络）的方法的。

下面这个研究比较了6种去除批次效应的方法，其中包括ComBat方法（parametric prior method，ComBat_p和non-parametric method，ComBat_n）、代理变量法（Surrogate variable analysis，SVA）、基于比值的方法（Geometric ratio-based method，Ratio_G）、平均中心方法（Mean-centering，PAMR）和距离加权判别（Distance-weighted discrimination，DWD）方法等。其中像combat和limma是自己以前在RNA-seq处理时候就接触和用过的。

也从5个参数（KBET、LISI、ASW、ARI和DEG），利用不同的类型的数据集对这些batch effect处理的方法进行了对比。

最后对于不同的数据集，给出了比较好的适应方法的建议。

我们最近有空也会对大多数工具进行一一的测试，看下性能和效应。

今天再学习一下combat。

早期的combat是为了处理microarray的batch effect的。

模型的假设是基于位置和尺度（Location and scale，L/S）的调整。L/S调整可以定义为一系列广泛的调整，其中为数据在批次内的位置（均值）和/或规模（方差）。

假设了一个模型，然后调整批次以满足假设模型的规范。因此，L/S批次调整假设批次效应可以通过标准化批次之间的均值和方差来建模。

这些调整可以从简单的基因范围的均值和方差标准化，到复杂的基因间线性或非线性调整。

其中：

Yijg表示来自批次i的样品j的基因g的表达值。

其中αg是基因g的平均表达值，X是样本条件的设计矩阵，βg是对应于X的回归系数向量。误差项εijg服从期望值为0和方差为σg的正态分布N(0，σg)，γig和δig表示批次i中基因g加法和乘法的批次效应。

算法总共分为三步：

后面的comBat-seq主要为了更好的处理RNA-seq数据，因为作者认为对于RNA-seq数据也假设为高斯分布，可能不适用于RNA-seq的表达值。所以为了更好的处理RNA-seq，作者把模型拓展为negative binomial distribution(负二项式分布)，然后基于负二项回归去处理模型。

===安装测试====

install.packages("sva")

library(sva)

library(bladderbatch)

使用内置的数据进行测试：

data(bladderdata)

dat <- bladderEset[1:50,]

pheno = pData(dat)

edata = exprs(dat)

batch = pheno$batch

//看下cluster的基本情况

dist_mat <- dist(t(edata))

clustering <- hclust(dist_mat, method ="complete")

plot(clustering, labels = pheno$batch)

plot(clustering, labels = pheno$cancer)

mod = model.matrix(~as.factor(cancer),data=pheno)

combat_edata <- ComBat(dat = edata,batch = pheno$batch, mod = mod)

注：校正批次效应,model可以有也可以没有，如果有，也就是告诉combat，有些分组本来就有差别，不要给我矫枉过正！

dist_mat_combat <- dist(t(combat_edata))

clustering_combat <-hclust(dist_mat_combat, method = "complete")

plot(clustering_combat, labels = pheno$batch)

plot(clustering_combat, labels = pheno$cancer)

本文使用文章同步助手同步

相关文章

GEO芯片联合分析批次校正combat/limma
批次校正的原因和方法校正批次效应这篇说可以用combat来进行批次校正校正批次效应这篇说limma和combat...
【批次效应】combat
现在其实已经有很多处理批次效应的方法，有基本基于中心值和方差调整的，也有的利用神经网络，或者机器学习（例如cell...
sva_combat校正批次效应
安装包使用内置数据使用Hierarchical clustering的方法去看一下聚类的情况校正批次效应,m...
sva ComBat去除GEO数据批次效应
批次效应批次效应是测量结果中的一部分，它们因为实验条件的不同而具有不同的表现形式，并且与我们研究的变量没有关系。...
批次效应（batch effects）
如何处理批次效应？搞定TCGA批次效应！?-sci666
RNA-seq 转录组批次效应校正 combat代码
在合并分析不同来源或不同数据集的时候，需要做一个合并前的批次校正，在校正前后，可用PCA聚类查看批次校正的效果，以...
PH525x series - Simpson’s Parado
batch effect（批次效应）在高通量研究中，常常被忽略的一个问题就是批次效应，简单的说，批次效应就是由实...
【单细胞测序】关于批次效应 batch effect
单细胞数据的处理过程中，让人头秃，批次效应一定有功。批次效应，顾名思义，不同批次带来的效应。考虑深层次造成批次...
困扰的batch effect
一、什么是批次效应批次效应（batch effect），表示样品在不同批次中处理和测量产生的与试验期间记录的任何...
刚入门时老师非要合并dataset时batch effect困扰
一、什么是批次效应批次效应（batch effect），表示样品在不同批次中处理和测量产生的与试验期间记录的任何...

网友评论

本文标题：【批次效应】combat

本文链接：https://www.haomeiwen.com/subject/cenfxrtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|【批次效应】combat|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！