美文网首页
单细胞Marker基因可示化包Nebulosa

单细胞Marker基因可示化包Nebulosa

作者: felix108 | 来源:发表于2021-10-17 16:52 被阅读0次

    与传统的转录组测序相比,单细胞测序技术噪声很大,使得单细胞转录组数据包含大量的dropout事件(导致基因表达量为0或接近0),即使是一些标记(Marker)基因也有可能表达量很低。当在使用其对聚类的细胞类型进行注释的时候,往往会影响可视化效果。

    Nebulosa是一个基于加权核密度估计新出的R包,用于可视化单细胞的数据。它的目的是通过纳入细胞之间的相似性,允许细胞特征的 "卷积",来恢复丢失的基因信号。

    数据准备 

    首先需要安装和加载相应的包:

    if (!requireNamespace("BiocManager", quietly = TRUE))

    install.packages("BiocManager")

    BiocManager::install("Nebulosa")

    library("Nebulosa")

    library("Seurat")

    测试数据选择10x Genomics 免费提供的外周血单核细胞(PBMC)数据集,约有2700个细胞(https://cf.10xgenomics.com/samples/cell/pbmc3k/pbmc3k_filtered_gene_bc_matrices.tar.gz),下载完解压获得单细胞表达矩阵文件夹。接下来就简单的导入数据对其进行质控啦。

    data <- Read10X(data.dir = "filtered_gene_bc_matrices/hg19/")

    pbmc <- CreateSeuratObject(counts = data,project = "pbmc3k",min.cells = 3,min.features = 200)

    pbmc[["percent.mt"]] <- PercentageFeatureSet(pbmc, pattern = "^MT-")

    pbmc <- subset(pbmc, subset = nFeature_RNA < 2500 & percent.mt < 5)

    接下来可以进行数据的标准化、降维、聚类,最后可以获得UMAP聚类图(Fig 1),结果保存为.rds文件。具体教程详见我们以往的文章《10x单细胞数据分析之Seurat》

    pbmc <- SCTransform(pbmc, verbose = FALSE)

    pbmc <- RunPCA(pbmc)pbmc <- RunUMAP(pbmc, dims = 1:30)

    pbmc <- FindNeighbors(pbmc, dims = 1:30)

    pbmc <- FindClusters(pbmc)

    DimPlot(pbmc, label = TRUE, repel = TRUE)

    saveRDS(pbmc,"pbmc.rds")

    Fig 1:UMAP聚类图

    Marker基因可视化 

    Nebulosa主函数是plot_density;和Seurat的 FeaturePlot 函数类似。通过下面两条代码,可以简单的对比一下。

    plot_density(pbmc, "CD4")

    FeaturePlot(pbmc, "CD4")

    Fig2:CD4在Nebulosa(左图)和FeaturePlot(右图)的UMAP可视化

    可视化结果发现,Nebulosa可视化(左图)会比Seurat自带的绘图函数(右图)效果好很多;同时也表明了CD4+ cell存在相当多的dropout。再加上CD3D可视化结果(Fig3),我们很容易可以判断cluster 0,1为 CD4+ T cell。

    Fig 3:CD3D UMAP可视化

    数据准备多个Marker基因联合可视化 

    知道了cluster 0,1是CD4+ T cell,让我们来鉴定Naive CD4+ T cells吧!更复杂的亚群鉴定需要多个marker一起来判定。只需要一行代码,Nebulosa可以将多个marker鉴定的结果组合起来。

    plot_density(pbmc, c("CD4", "CCR7"), joint = TRUE)[[3]]

    Fig 4:Naive CD4+ T cells鉴定

    我们很容易鉴定Naive CD4+ T cells,值得注意的是这些细胞主要包含于cluster 0(CD4+ T cell)(Fig 4)。

    熟悉PBMC的读者应该知道,Naive CD8+ T cells(CD8+CCR7+细胞)通常聚集在CD4+CCR7+旁边,与其他CD8+细胞分开。我们也可以验证这一点,下图鉴定了cluster 9为Naive CD8+ T cell,它聚集在CD4+CCR7+旁边(Fig5)。

    plot_density(pbmc, c("CD8A", "CCR7"), joint = TRUE)[[3]]

    Fig 5:Naive CD8+ T cells的鉴定

    总之,Nebulosa对于检测dropped-out genes信号和改善其在低维空间的可视化是有效的,对于基因表达较好的基因,直接基因表达可视化是更好的选择。我们可以多多尝试Nebulosa和Seurat以及Bioconductor中其他可视化方法一起使用,进而得出更加可靠的分析结论。

    相关文章

      网友评论

          本文标题:单细胞Marker基因可示化包Nebulosa

          本文链接:https://www.haomeiwen.com/subject/rpynoltx.html