Seurat包介绍,它是用于单细胞转录组分析
先用相关函数读取数据,包里的Read10X()
1.预处理:性状标准化
pbmc<-ScaleData(pbmc)
2.找出:关键性状(高变基因)差异大的基因就是高变基因
pbmc<-FindVariableFeatures(pbmc,selection.method="vst",nfeatures=2000)设定2000个高变基因
plot<-VariableFeaturePlot(pbmc)
红色为高变基因3.降维(因为2000个高变基因还是较多的,需要降维,减少高变基因,例如降低到10个高变基因代替这2000个高变基因。
pbmc<-RunPCA(pbmc,features=VariableFeatures(object=pbmc))
Dimplot(pbmc,reduction="pca") PC_1为第一主分析,PC_2为第二,重要程度上1>2,因为pc_1解释的权重更大。
PCA降维pca:主成分分析,是一种降维技巧,将大量的相关变量转化为很少的无关变量,例如一群细胞,通过它的形状颜色等进行分为几大类。有两个细胞,很多个基因,把每个基因的测量结果绘制在图上,基因1在细胞1高度转录,在细胞2低转录·····,这就意味着这是两类不同的细胞,因为他们在使用不同的基因。上图为主成分分析图pca,pca图将细胞之间的相关性(或不相关)转化为2-D图,高度相关的聚集在一起,
Elbowplot(pbmc)#通过这个图,找到拐点,确定pca值为10,确定维度,分为10类
找拐点4.进行聚类
数据进行降维后,在进行聚类分群
UMAP聚类
pbmc<-RunUMAP(pbmc,dims=1:10)
Dimplot(pbmc,reduction="umap")可视化
tSNE聚类
pbmc<-RunTSNE(pbmc,dims=1:10)
DimPlot(pbmc,reduction="tsne")可视化
网友评论