前言
EcoTyper是一个基于机器学习的工具,能够从Bulk、单细胞、以及空间分辨率的基因表达数据中大规模地识别并验证细胞状态和生态型。我们在前面的推文中介绍了EcoTyper的分析框架和部分实操内容,感兴趣的小伙伴可以先阅读这一部分哦。
EcoTyper的代码实操主要分为6个部分:
image.png那么,今天让我们一起来学习一下它的第三个部分——Recovery of Cell States and Ecotypes in Spatial Transcriptomics data。
代码流程
1.准备环境和数据
下载 EcoTyper
wget https://github.com/digitalcytometry/ecotyper/archive/refs/heads/master.zip
unzip master.zip
cd ecotyper-master
#EcoTyper是一个独立的软件,用R实现,但并不是R包哦。```
##### R环境准备:
![image.png](https://img.haomeiwen.com/i21134748/e12e79cc53a3b4d9.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
这是官网推荐的R和R包版本,但是小编用的最新的R版本,并且安装相应最新版本的R包也是很顺利的。
install.packages(c("RColorBrewer","cluster", "circlize","cowplot","data.table","doParallel","ggplot2","grid", "reshape2", "viridis","config","argparse","colorspace", "plyr"))
BiocManager::install("ComplexHeatmap")
BiocManager::install("Biobase")
BiocManager::install("NMF")```
其他:
安装Docker。
获取CIBERSORTx Fractions和CIBERSORTx HiRes模块的Docker容器,这两个模块可以从CIBERSORTx网站获取,需要按照网站上的说明进行安装。
从CIBERSORTx网站获取运行Docker容器所需的token。
输入数据:
- 空间转录组数据:乳腺癌Visium Spatial Gene Expression 10x Genomics数据,数据存储在
example_data/VisiumBreast
中。
2.recovery scripts
EcoTyper_recovery_visium.R
脚本用于在空间转录组数据中恢复细胞状态和生态型。
EcoTyper_recovery_visium.R -h
此脚本接受 YAML 格式的配置文件作为输入文件。
image.png
参数详解:
- Discovery dataset name : "Carcinoma"
默认情况下,系统预设了两个可接受的值,分别是 "Carcinoma" 和 "Lymphoma" 。
- Recovery dataset name : "VisiumBreast"
恢复数据集的名称
- Input Visium directory : "example_data/VisiumBreast"
Path to a file containing the precomputed cell fractions for the visium array
- Recovery cell type fractions : "NULL"
当 "discovery dataset" 是 "Carcinoma" 或 "Lymphoma"时,次字段被忽略。
它仅在用户自己提供了细胞类型分数用于推到细胞状态和生态型的情况下使用。
- Background cell type : "Epithelial.cells"
癌症类型的起源细胞群
- CIBERSORTx fractions Singularity path : NULL
如果提供了 Singularity 容器的路径,那么 CIBERSORTx fractions 模块将使用 Singularity 来执行细胞比例的估算。否则,默认情况下,Docker 将被用来执行这个任务。
运行脚本:
Rscript EcoTyper_recovery_visium.R -c config_recovery_visium.yml
3.结果解读
输出的结果主要包括3种文件
- 细胞状态丰度估计文件:state_abundances.txt
- 生态型丰度估计文件:ecotype_abundances.txt
- 每种细胞类型跨越状态的细胞状态丰度的图。这里我们以成纤维细胞为例展示结果:
- 基于这些结果,我们可以做哪些下游分析呢?
-
分析每个细胞状态或生态型与特定区域(例如,肿瘤区域或基质区域)之间的距离。
-
细胞状态或生态型间的聚集模式:细胞状态或生态型是否呈现出其他特定的空间模式。
-
细胞状态/生态型相互作用模式:探索不同细胞状态和生态型之间的通讯和相互作用。
小结
在本期推文中,我们介绍了如何使用EcoTyper对空间转录组数据进行细胞状态和生态型的分析。在前三期的实操推文中,我们主要学习如何在独立数据集(Bulk、单细胞以及空间转录组)中恢复特定的细胞状态和生态型。接下来的三期实操推文,我们将与大家一起学习如何在Bulk数据、单细胞数据以及经过细胞类型分选的转录组数据中发现细胞状态和生态型。我们将在下期推文中和大家一起学习EcoTyper的实操--De novo Discovery of Cell States and Ecotypes in Bulk Data,关于今天的学习内容,感兴趣的小伙伴快来用起来吧~
好啦,本期的分享到这里就结束了,我们下期再会~
网友评论