通过对Seurat 包的装饰,提高 scRNA-seq 数据的处理和可视化能力
Scillus有两种使用方式:
- 从原始数据开始,您应该浏览以下所有部分。
- 从数据整合好的Seurat对象,提高绘图功能,安装好Scillus后可以直接进入Plotting。
接下来我们将分四个步骤进行解读:
- 1.Scillus安装
- 2.配置文件准备
- 3.原始数据的处理
- 4.绘图(可视化)
1.Scillus安装
请使用以下代码安装:
if (!require(devtools)) {
install.packages("devtools")
}
devtools::install_github("xmc811/Scillus", ref = "development")
2.配置文件准备
样本数据
示例使用的数据集来自Gaydosik AM等人的研究。它可以从此处下载数据。下载后的文件解压tar xvzf GSE128531.tar.gz
。单个.csv.gz
文件不需要进行解压缩。为了减少计算时间,数据集仅包含 6 个样本和每个样本 300 个细胞。完整的原始数据可通过GEO 获取。
样本数据格式为:.csv.gz
,但 Scillus 也适用于 10x Genomics cellranger 输出格式,如下所示:
$ tree filtered_feature_bc_matrix
filtered_feature_bc_matrix
├── barcodes.tsv.gz
├── features.tsv.gz
└── matrix.mtx.gz
metadata数据
由于每个 scRNA-seq 对象的样本通常不止一个,Scillus 的加载和过滤函数将生成和处理 Seurat 对象列表。应向加载函数提供metadata数据。metadata数据应至少有两列:一列名为sample
,另一列名为file
或folder
,具体取决于输入数据格式。对于示例数据,metadata数据可以通过以下方式构建:
library(tidyverse)
a <- list.files("your/path/to/sample/data/GSE128531_RAW", full.names = TRUE)
m <- tibble(file = a,
sample = stringr::str_remove(basename(a), ".csv.gz"),
group = rep(c("CTCL", "Normal"), each = 3))
file | sample | group |
---|---|---|
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/CTCL-5.csv.gz | CTCL-5 | CTCL |
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/CTCL-6.csv.gz | CTCL-6 | CTCL |
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/CTCL-8.csv.gz | CTCL-8 | CTCL |
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/HC-1.csv.gz | HC-1 | Normal |
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/HC-2.csv.gz | HC-2 | Normal |
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/HC-3.csv.gz | HC-3 | Normal |
metada数据中的其他相关信息(例如组、性别、年龄、治疗)都可以加到数据表中,并且它们包含在 Seurat 对象中。此处添加group
列是为了演示目的。
对于 10x Genomics cellranger 输出,metadata数据应该有一个列命名folder
(如下表)而不是file
,并且每个文件夹中应该有 3 个文件,如上所示的树结构。
folder | sample | group |
---|---|---|
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/CTCL-5 | CTCL-5 | CTCL |
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/CTCL-6 | CTCL-6 | CTCL |
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/CTCL-8 | CTCL-8 | CTCL |
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/HC-1 | HC-1 | Normal |
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/HC-2 | HC-2 | Normal |
/Users/mxu3/Documents/projects/Scillus/test/GSE128531_RAW/HC-3 | HC-3 | Normal |
对调色板的设置
Scillus 的绘图功能将结合调色板(Palette)设置,以确保不同类型绘图中每个变量的着色方案一致。
pal <- tibble(var = c("sample", "group","seurat_clusters"),
pal = c("Set2","Set1","Paired"))
var | pal |
---|---|
sample | Set2 |
group | Set1 |
seurat_clusters | Paired |
网友评论