前言
说到单细胞数据分析,不得不提的一个工具就是基于R语言构建的一站式分析软件--Seurat。即使目前每年都有很多新的单细胞工具被开发出来,Seurat仍然是目前市场占有率最高,使用最广泛的工具。而且最难能可贵的是Seurat一直都在Rahul Satija的带领下不断更新,不断完善。
image.png鉴于本篇推文内容有限,Immugent只从几个角度对Seurat v5进行一个大致介绍,希望能起到抛砖引玉的作用,鼓动大家去官网系统学习。
主要内容
我们知道,2009年单细胞测序的概念首次被汤富酬老师提出,但是直到2015年前后这项技术才被广泛应用。其中最主要的一个原因就是在2015年出现了一个划时代的单细胞分析工具--Seurat,而且第一版就发在了著名的NBT杂志上。随后,Seurat为了满足单细胞测序新技术的分析需求下,在不断完善其功能:2018年的v2,2019年的v3和最近一次在2021年更新的v4。
image.png就在最近,Seurat重磅推出了它的v5版本,虽然目前发表在预印刊杂志--bioRxiv上,但是Immugent相信很快就会被各大杂志抢着发表。
image.png需要强调的是,Seurat的每一个高级版本都向下兼容,因此,以往的分析流程在v5中还是可以正常运行的。此外,这次更新的v5对很多流程进行了优化,其中Immugent想最先介绍的就是它的整合算法。这次更新的IntegrateLayers函数,整合了CCA,RPCA,Harmony,FastMNN,scVI等很多其它主流R包的方法。
image.png其次,随着单细胞数据越来越庞大,对计算资源的需求越来越高。因此,这次Seurat v5提出了不同于之前的运行数据存储理念,大大降低了对运行内存的依赖,并加快了数据读取、存储的速度。
image.png还有要强调的是Seurat v5这次极大的完善了单细胞多组学数据处理的需求,特别是对单细胞空间转录组数据的处理上进行了极大的提升。除此之外,还有对表观组学:scATAC-seq,scBS-seq和scCUT&Tag单细胞数据的整合分析。
image.png此外,Seurat v5增加了更多类型单细胞数据的接口,包括了:10x Visium, SLIDE-seq, Vizgen MERSCOPE, 10x Xenium, Nanostring CosMx, and Akoya CODEX。
最后,Immugent给出Seurat v5版本的安装代码,大家赶紧用起来吧。
## 安装Seurat v5版本
remotes::install_github("satijalab/seurat", "seurat5", quiet = TRUE)
## 一些依赖的新的数据集和包
remotes::install_github("satijalab/seurat-data", "seurat5", quiet = TRUE)
remotes::install_github("satijalab/azimuth", "seurat5", quiet = TRUE)
remotes::install_github("satijalab/seurat-wrappers", "seurat5", quiet = TRUE)
remotes::install_github("stuart-lab/signac", "seurat5", quiet = TRUE)
## 安装处理大数据的依赖包BPCells
remotes::install_github("bnprks/BPCells", quiet = TRUE)
说在最后
Seurat的这次更新可以说是具有划时代意义的,基本考虑到了目前单细胞测序数据分析的全部问题,具体的内容大家可以去Seurat的官网系统学习。
此外,还值得一提的是从Seurat V4开始,这个包的第一作者就变成了华人学者--Yuhan Hao。这位大佬行事很低调,很少出现在公众媒体,但是实力超凡,值得我们每一个人学习。
image.png好啦,本期分享到这里就结束了,我们下期再会~~
[参考文献]
Dictionary learning for integrative, multimodal, and scalable single-cell analysis bioRxiv 2022.02.24.481684; doi: https://doi.org/10.1101/2022.02.24.481684.
网友评论