美文网首页单细胞组学单细胞测序
单细胞测序之差异表达基因获得方法

单细胞测序之差异表达基因获得方法

作者: 吹不散的烽烟 | 来源:发表于2022-06-03 23:15 被阅读0次

    1.加载数据

    library(Seurat)
    library(SeuratData)
    pbmc <- LoadData("pbmc3k", type = "pbmc3k.final")
    > pbmc
    An object of class Seurat 
    13714 features across 2638 samples within 1 assay 
    Active assay: RNA (13714 features, 2000 variable features)
     2 dimensional reductions calculated: pca, umap
    

    2.执行默认的差异表达测试

    Seurat 的大部分差异表达特征可以通过“FindMarkers()”函数访问。 默认情况下,Seurat 基于非参数 Wilcoxon 秩和检验执行差分表达式。 这取代了以前的默认测试('bimod')。 要测试两组特定细胞之间的差异表达,请指定“ident.1”和“ident.2”参数。

    # list options for groups to perform differential expression on
    > levels(pbmc)
    [1] "Naive CD4 T"  "Memory CD4 T" "CD14+ Mono"   "B"            "CD8 T"       
    [6] "FCGR3A+ Mono" "NK"           "DC"           "Platelet" 
    # Find differentially expressed features between CD14+ and FCGR3A+ Monocytes
    >monocyte.de.markers  <- FindMarkers(pbmc, ident.1 = "CD14+ Mono", ident.2 = "FCGR3A+ Mono")
    |++++++++++++++++++++++++++++++++++++++++++++++++++| 100% elapsed=04s 
    # view results
    > head(monocyte.de.markers)
                   p_val avg_log2FC pct.1 pct.2    p_val_adj
    FCGR3A 1.193617e-101  -3.776553 0.131 0.975 1.636926e-97
    LYZ     8.134552e-75   2.614275 1.000 0.988 1.115572e-70
    RHOC    4.479768e-68  -2.325013 0.162 0.864 6.143554e-64
    S100A8  7.471811e-65   3.766437 0.975 0.500 1.024684e-60
    S100A9  1.318422e-64   3.299060 0.996 0.870 1.808084e-60
    IFITM2  4.821669e-64  -2.085807 0.677 1.000 6.612437e-60
    

    查找 CD14+ 单核细胞与所有其他细胞之间的差异表达特征

    monocyte.de.markers  <- FindMarkers(pbmc, ident.1 = "CD14+ Mono", ident.2 = NULL, only.pos = TRUE)
    head(monocyte.de.markers) 
    

    3.预过滤基因或细胞以提高 DE 的速度

    为了提高差异基因发现的速度,特别是对于大型数据集,Seurat 允许对基因或细胞进行预过滤。 例如,在任一组细胞中很少检测到的特征基因,或者以相似的平均水平表达的特征,不太可能被差异表达。 min.pctlogfc.thresholdmin.diff.pctmax.cells.per.ident 参数的示例用例如下所示。

    head(FindMarkers(pbmc, ident.1 = "CD14+ Mono", ident.2 = "FCGR3A+ Mono", min.pct = 0.5))
    head(FindMarkers(pbmc, ident.1 = "CD14+ Mono", ident.2 = "FCGR3A+ Mono", logfc.threshold = log(2)))
    head(FindMarkers(pbmc, ident.1 = "CD14+ Mono", ident.2 = "FCGR3A+ Mono", min.diff.pct = 0.25))
    head(FindMarkers(pbmc, ident.1 = "CD14+ Mono", ident.2 = "FCGR3A+ Mono", max.cells.per.ident = 200))
    

    4.使用替代统计方法执行 DE 分析 (中文翻译可能不准)

    • "wilcox":Wilcoxon 秩和检验(默认)
    • "bimod":单细胞特征表达的似然比检验
    • "roc" : 标准 AUC 分类器
    • "t" : 学生 t 检验
    • “泊松”:假设潜在负二项分布的似然比检验。仅用于基于 UMI 的数据集
    • “negbinom”:假设潜在负二项分布的似然比检验。仅用于基于 UMI 的数据集
    • “LR”:使用逻辑回归框架来确定差异表达的基因。构建基于每个特征单独预测组成员的逻辑回归模型,并将其与具有似然比检验的空模型进行比较。
    • “MAST”:将细胞检测率视为协变量的 GLM 框架
    • “DESeq2”:DE 基于使用负二项分布的模型
    # necessary to get MAST to work properly
    library(SingleCellExperiment)
    
    head(FindMarkers(pbmc, ident.1 = "CD14+ Mono", ident.2 = "FCGR3A+ Mono", test.use = "MAST"))
    head(FindMarkers(pbmc, ident.1 = "CD14+ Mono", ident.2 = "FCGR3A+ Mono", test.use = "DESeq2", max.cells.per.ident = 50))
    

    相关文章

      网友评论

        本文标题:单细胞测序之差异表达基因获得方法

        本文链接:https://www.haomeiwen.com/subject/msnhmrtx.html