美文网首页10X genomicsseurat
DoubletFinder 去除双细胞

DoubletFinder 去除双细胞

作者: 大吉岭猹 | 来源:发表于2020-05-31 18:28 被阅读0次

1. 参考资料

2. DoubletFinder 概述

  • 首先这个包的输入是经过预处理(包括归一化、降维,但不一定要聚类)的 Seurat 对象
  • doubletFinder_v3 的部分参数
    • seu,一个经过充分处理的 Seurat 对象(具体如前所述
    • PCs,根据自己数据的实际情况选择有统计学意义的 PC,具体如何选择见:https://www.jianshu.com/p/ddf520db5d6f 的 4.1 节
    • pN,定义生成的人工双峰的数量,表示为合并的真实人工数据的一部分,默认设置为 25%
    • pK,定义用于计算 pANN 的 PC 邻域大小,表示为合并的真实 real-artificial 数据的一部分,对于每个 scRNA-seq 数据集都需要调整 pK,止于 pK 怎么挑,我摊牌了,不想学,具体见文首的链接
    • nExp,定义了用于进行最终 doublet/singlet 预测的 pANN 阈值,可以从 10X / Drop-Seq 装置中的细胞装载密度来最好地估计该值,并根据 homotypic doublets 对估计比例进行调整。
    • sct 取决于你走的 Seurat 流程是用 NormalizeData() + FindVariableFeatures() + ScaleData() 还是 SCTransform()
  • 注意:不能用于整合了多个样本(在不同 lane 测序)的 Seurat 对象

3. 代码

## 因为几乎全都是中间变量,就没好好命名
# 找最佳 PK
sweep.res.list_kidney <- paramSweep_v3(seurat, PCs = 1:40, sct = T)
sweep.stats_kidney <- summarizeSweep(sweep.res.list_kidney, GT = FALSE)
bcmvn_kidney <- find.pK(sweep.stats_kidney)
mpK<-as.numeric(as.vector(bcmvn_kidney$pK[which.max(bcmvn_kidney$BCmetric)]))

# 找最佳 nExp
annotations <- seurat@meta.data$seurat_clusters
homotypic.prop <- modelHomotypic(annotations)
nExp_poi <- round(0.075*ncol(seurat@assays$integrated@data))
nExp_poi.adj <- round(nExp_poi*(1-homotypic.prop))

# 找 Doublet
seurat_filterDouble <- doubletFinder_v3(seurat, PCs = 1:40, pN = 0.25, pK = mpK, nExp = nExp_poi, reuse.pANN = FALSE, sct = T)

4. 结果

> table(seurat_integrated_filterDouble$DF.classifications_0.25_0.28_1042)

Doublet Singlet
   1042   12849
image

友情宣传

相关文章

网友评论

    本文标题:DoubletFinder 去除双细胞

    本文链接:https://www.haomeiwen.com/subject/drerzhtx.html