R package：Seurat 寻找高变基因的意义（二）

作者: 佳名 | 来源:发表于2023-06-15 11:34 被阅读0次

Seurat包学习笔记（一）：Guided Clustering
Seurat包学习笔记（九）：Differential expr
10X空间转录组-----空间高变基因检测之SpatialDE
R package：Seurat的安装
利用igraph包可视化基于KNN的单细胞聚类关系
2021-05-11 scRNA基础分析：降维与聚类
R package：RIdeogram （三）展示数据的准备
R package：Seurat 理解S4类
FindConservedMarkers vs FindMark
2020-04-09 could not find functi

1.载入包和数据

library(Seurat)
# Load the PBMC dataset 读取数据
pbmc.data <- Read10X(data.dir ="./")
dim(pbmc.data)
#[1] 32738  2700

此时有2700个细胞，32738个features（基因）。

2.创建Seurat对象

pbmc <- CreateSeuratObject(counts = pbmc.data, 
                           project = "pbmc3k", min.cells = 3, min.features = 200)

dim(pbmc)
#[1] 13714  2700

min.cells是过滤features的参数，min.features是过滤细胞的参数。由此可见，导入过程中过滤掉一些features，只剩下13714个基因。

3.数据进行标准化

寻找高变基因之前必须对数据进行标准化，每个细胞的测序深度，或者测序得到的UMI总数是不一样的，因此同一个feature(基因)在不同样品间的表达量是不能直接进行比较的，需要将之标准化。

pbmc <- NormalizeData(pbmc, 
                      normalization.method = "LogNormalize", 
                      scale.factor = 10000)

4.寻找高变基因并可视化

pbmc <- FindVariableFeatures(pbmc, 
                             selection.method = "vst", 
                             nfeatures = 2000)
plot1 <- VariableFeaturePlot(object = pbmc)
plot1

高变基因

在上图中，横坐标为基因在所有细胞中的表达水平（log10对数值），纵坐标为基因在所有细胞中的表达水平的标准差，数值越大，表示该基因在细胞中的表达水平越不稳定。

library(ggplot2)
p <- ggplot(plot1$data,aes(log10(mean),variance.standardized,color = colors))+
  geom_point()+theme_bw()
p

高变基因plot

那为什么要挑选高变基因呢，本质其实还是降维（13714个基因降低到2000个），为后续PCA分析，减少计算机运算量。如果后续PCA聚类分析是对所有基因进行，那就没必要寻找高变基因了
那为什么是高变基因而不是恒定表达的基因呢，因为PCA聚类分析中区分不同细胞亚型贡献最大的就是这些高变基因。

网友评论

本文标题：R package：Seurat 寻找高变基因的意义（二）

本文链接：https://www.haomeiwen.com/subject/xbclydtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

R package：Seurat 寻找高变基因的意义（二）

1.载入包和数据

2.创建Seurat对象

3.数据进行标准化

4.寻找高变基因并可视化

相关文章

Seurat包学习笔记（一）：Guided Clustering

Seurat包学习笔记（九）：Differential expr

10X空间转录组-----空间高变基因检测之SpatialDE

R package：Seurat的安装

利用igraph包可视化基于KNN的单细胞聚类关系

2021-05-11 scRNA基础分析：降维与聚类

R package：RIdeogram （三）展示数据的准备

R package：Seurat 理解S4类

FindConservedMarkers vs FindMark

2020-04-09 could not find functi

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读