1.加载数据
library(Seurat)
library(SeuratData)
pbmc <- LoadData("pbmc3k", type = "pbmc3k.final")
> pbmc
An object of class Seurat
13714 features across 2638 samples within 1 assay
Active assay: RNA (13714 features, 2000 variable features)
2 dimensional reductions calculated: pca, umap
2.执行默认的差异表达测试
Seurat 的大部分差异表达特征可以通过“FindMarkers()”函数访问。 默认情况下,Seurat 基于非参数 Wilcoxon 秩和检验执行差分表达式。 这取代了以前的默认测试('bimod')。 要测试两组特定细胞之间的差异表达,请指定“ident.1”和“ident.2”参数。
# list options for groups to perform differential expression on
> levels(pbmc)
[1] "Naive CD4 T" "Memory CD4 T" "CD14+ Mono" "B" "CD8 T"
[6] "FCGR3A+ Mono" "NK" "DC" "Platelet"
# Find differentially expressed features between CD14+ and FCGR3A+ Monocytes
>monocyte.de.markers <- FindMarkers(pbmc, ident.1 = "CD14+ Mono", ident.2 = "FCGR3A+ Mono")
|++++++++++++++++++++++++++++++++++++++++++++++++++| 100% elapsed=04s
# view results
> head(monocyte.de.markers)
p_val avg_log2FC pct.1 pct.2 p_val_adj
FCGR3A 1.193617e-101 -3.776553 0.131 0.975 1.636926e-97
LYZ 8.134552e-75 2.614275 1.000 0.988 1.115572e-70
RHOC 4.479768e-68 -2.325013 0.162 0.864 6.143554e-64
S100A8 7.471811e-65 3.766437 0.975 0.500 1.024684e-60
S100A9 1.318422e-64 3.299060 0.996 0.870 1.808084e-60
IFITM2 4.821669e-64 -2.085807 0.677 1.000 6.612437e-60
查找 CD14+ 单核细胞与所有其他细胞之间的差异表达特征
monocyte.de.markers <- FindMarkers(pbmc, ident.1 = "CD14+ Mono", ident.2 = NULL, only.pos = TRUE)
head(monocyte.de.markers)
3.预过滤基因或细胞以提高 DE 的速度
为了提高差异基因发现的速度,特别是对于大型数据集,Seurat 允许对基因或细胞进行预过滤。 例如,在任一组细胞中很少检测到的特征基因,或者以相似的平均水平表达的特征,不太可能被差异表达。 min.pct
、logfc.threshold
、min.diff.pct
和 max.cells.per.ident
参数的示例用例如下所示。
head(FindMarkers(pbmc, ident.1 = "CD14+ Mono", ident.2 = "FCGR3A+ Mono", min.pct = 0.5))
head(FindMarkers(pbmc, ident.1 = "CD14+ Mono", ident.2 = "FCGR3A+ Mono", logfc.threshold = log(2)))
head(FindMarkers(pbmc, ident.1 = "CD14+ Mono", ident.2 = "FCGR3A+ Mono", min.diff.pct = 0.25))
head(FindMarkers(pbmc, ident.1 = "CD14+ Mono", ident.2 = "FCGR3A+ Mono", max.cells.per.ident = 200))
4.使用替代统计方法执行 DE 分析 (中文翻译可能不准)
- "wilcox":Wilcoxon 秩和检验(默认)
- "bimod":单细胞特征表达的似然比检验
- "roc" : 标准 AUC 分类器
- "t" : 学生 t 检验
- “泊松”:假设潜在负二项分布的似然比检验。仅用于基于 UMI 的数据集
- “negbinom”:假设潜在负二项分布的似然比检验。仅用于基于 UMI 的数据集
- “LR”:使用逻辑回归框架来确定差异表达的基因。构建基于每个特征单独预测组成员的逻辑回归模型,并将其与具有似然比检验的空模型进行比较。
- “MAST”:将细胞检测率视为协变量的 GLM 框架
- “DESeq2”:DE 基于使用负二项分布的模型
# necessary to get MAST to work properly
library(SingleCellExperiment)
head(FindMarkers(pbmc, ident.1 = "CD14+ Mono", ident.2 = "FCGR3A+ Mono", test.use = "MAST"))
head(FindMarkers(pbmc, ident.1 = "CD14+ Mono", ident.2 = "FCGR3A+ Mono", test.use = "DESeq2", max.cells.per.ident = 50))
网友评论