vignettes/SC3/
我们之前在SC3 : 单细胞转录组聚类分析R包中介绍过SC3聚类算法,对于细胞异质性未知的样本,聚成几个类我们不知道,这时候可以多尝试几种聚类策略。SC3这个时候就派上用场了。
分别聚成10个类的结果SC3在可视化上面为我们贡献了几张热图,那么他们都是什么意思呢?
Consensus Matrix
sc3_plot_consensus(sce, k = 3)
共识矩阵是一个N×N矩阵,其中N是输入数据集中的细胞数。根据所有聚类参数组合的聚类结果的平均值,表示细胞之间的相似性。similarity 0(蓝色)表示这两个细胞总是被分配到不同的群。相反,similarity 1(红色)表示这两个细胞总是被分配到相同的群。共识矩阵采用层次聚类方法进行聚类,具有对角块结构。直观地说,当所有对角块都是完全红色,所有非对角元素都是完全蓝色时,就可以实现完美的聚类。
Expression Matrix
sc3_plot_expression(sce, k = 3)
表达热图表示基因以kmeans进行聚类,k = 100(左侧为树状图),heatmap表示基因簇中心在log2- scale后的表达水平。
DE genes
sc3_plot_de_genes(sce, k = 3)
差异基因的计算采用非参数Kruskal-Wallis检验。SC3提供了调整p值< 0.01的所有差异表达基因的列表,并绘制了p值最低的50个基因的基因表达谱。值得注意的是,聚类后的差异表达计算可能会在p值的分布中引入偏差,因此我们建议仅使用p值对基因进行排序。
Marker Genes
sc3_plot_markers(sce, k = 3)
为了找到标记基因,每个基因都建立一个基于平均聚类表达值的二元分类器。然后利用基因表达序列计算分类器预测,ROC曲线下的面积用来量化预测的准确性。利用Wilcoxon符号秩检验为每个基因分配一个p值。默认选择ROC曲线下面积(AUROC)为> 0.85且p值< 0.01的基因,在此heatmap中显示每个簇的前10个标记基因。
网友评论