前言
在前几天的一篇推文中:使用CytoTRACE评估细胞干性和分化潜力,Immugent就已经介绍了目前用于单细胞数据的细胞分化潜力评估的一大神器--CytoTRACE,并且预告了今天的主角SCENT。那么今天Immugent就来细说SCENT相对于CytoTRACE的不同之处。
事实上,SCENT发表的时间比CytoTRACE还早,它的第一版早在2017年就发表在NATURE COMMUNICATIONS杂志上了,但是后面好像用的人并不多。原因可能是它不够智能,需要做很多准备工作,SCENT的输入需要两个文件,一个是基因表达谱文件,一个是各细胞对应的meta信息,这两个都需要单独制作;此外,还需要PPI的调控矩阵信息,而它都是Entrez ID,这就需要我们将我们的表达矩阵做对应的转化。但是整体上来看,SCENT的分析结果还是相当准确的,那么下面我们就来全面了解一下这个软件吧。
主要内容
文章第一幅图就是介绍了SCENT的工作框架,理解这个过程是基于我们后来称之为细胞分化的沃丁顿景观,其中单细胞信号熵作为其分化潜力的主要驱动者。如下图A中所示的细胞群,其中细胞处于多能状态(红色)、祖细胞(青色)或分化状态(绿色)。每个细胞的效力状态是由该细胞的转录组谱x的复杂功能决定的。对于网络中蛋白质i和k之间的给定相互作用,给定细胞中的信号以概率pikBxixk发生,定义了随机矩阵P¼(pik)。
image.png在多能状态下,对表型可塑性的要求很高,因此混杂的信号蛋白(即高连通性的信号蛋白)高表达(红色节点),所有主要分化途径保持在相似的基础活性水平(灰色边缘)。因此,蛋白质i和k之间的信号传递概率pik为1/ki,其中ki是蛋白质i在网络中的连通性。因此节点i周围的局部信号熵最大。在分化状态下,对特定谱系的承诺(红色节点所示的特定信号通路的激活)意味着大多数pijB0,除了j¼k,使pikB1。因此,节点i周围的局部信令熵接近于零。
image.png为了测试信号熵与分化效能的相关性,作者首先对Chu等人21生成的1018个单细胞RNA-Seq谱进行了估计,其中包括代表三个主要胚层(内胚层、中胚层和外胚层)的多能性人类胚胎干细胞(hESCs)和hesc衍生的祖细胞。这些细胞包括来自两个hESC系(H1和H9)的374个细胞,173个神经祖细胞(npc), 138个确定的内胚层祖细胞(DEPs), 105个内皮细胞(ECs)代表中胚层衍生物,以及69个滋养细胞(TB)和148个人包皮成纤维细胞(HFFs)。证实了我们的假设,多能hESCs获得了最高的信号熵值,其次是多能细胞(npc, dep),多能HFFs, TBs和ec获得了最低的信号熵值。
image.png先前的研究提出,细胞群体的表达异质性是由群体中单个细胞的转录组以一种优化目标功能(如多能性或稳态)的方式进行调节的。为了测试信号熵是否可以预测这种调控表达的异质性,作者将单细胞熵的分布与大群体的信号熵进行了比较。具体来说,我们设计了一种“规范异质性测量”(MRH),它测量了从该细胞群中随机挑选一个细胞,观察到细胞群信号熵的可能性。
image.png文章最后一幅图就是对调控表达异质性(MRH)测量进行介绍,MRH是一个z-统计量,通过测量总体表达谱的信号熵(SR)与单细胞熵平均值的偏差获得,考虑到群体中单细胞熵的可变性。
展望
SCENT相对于CytoTRACE的最大优势就是它的分析结果是可以输出并且量化的,那么这也意味着,我们可以将它的分析结果和其它特征或者表型信息联系起来。同样,不足之处就是它不是很智能,需要我们分别准备表达谱文件和表型文件,而CytoTRACE的输入文件可以是直接由Seurat对象转化的。此外,SCENT的第一版运行速度相对还是很慢的,这个问题在它的第二版,也就是Immugent接下来会介绍的CCAT中有很大的提升,欢迎大家持续关注。
好啦,本期分享到这里就结束了,我们下期再会~~
[参考文献]
Teschendorff AE, Enver T. Single-cell entropy for accurate estimation of differentiation potency from a cell's transcriptome. Nat Commun. 2017 Jun 1;8:15599. doi: 10.1038/ncomms15599. PMID: 28569836; PMCID: PMC5461595.
网友评论