前 言
多细胞生物中包含多种细胞类型,每种细胞类型都有其各自的形态和功能,而细胞类型的特性需要由转录因子与其相应的靶基因共同协调相互作用来维持。目前,借助单细胞转录组测序技术,基于单细胞水平的基因表达数据可以建立系统的基因调控网络 (Gene Regulatory Network, GRN),绘制相应的细胞图谱。
细胞的转录状态来源于潜在的基因调控网络(GRN),它包括一定数量的转录因子和辅因子及其下游靶基因[1]。通过SCENIC软件我们可以有效识别转录因子(TFs)与潜在靶基因之间的共表达模块(Regulon)。在开始之前,让我们先来了解以下几个概念吧~
什么是Regulon调控子?
Regulon调控子是受同一个调控元件(转录因子)调控的一群基因的集合。每个调控子可以定义为一个转录因子及其靶基因的集合。
什么是基因调控网络(GRN)?
这里的基因调控网络(GRN)是指转录因子(TF)与特定mRNA的TF结合位点之间的调控关系的集合,从而控制mRNA的表达水平及其产生的蛋白质。
Regulon调控子分析能做什么?
识别单细胞转录组数据中的转录因子及其靶基因,鉴定Regulon。
找到共同调控下游基因,负责细胞功能的高关联性Regulon。
构建不同细胞类型中的基因调控网络。
确定维持细胞特性的重要调控子。
如何实现Regulon调控子分析?
利用SCENIC软件,可以有效识别Regulon调控子以及每个细胞的Regulon活性得分(RAS, regulon activity score);通过计算Regulon特异性得分(RSS, Regulon specificity score)可以获取Regulon与每种细胞类型的特定对应关系;利用Regulon的关联特异性指数(CSI, connection specificity index)来表示不同Regulon之间的关联性,同时具有较高CSI的Regulon可能共同调控下游基因,并共同负责细胞功能。
SCENIC是一款基于单细胞RNA-seq数据,推断基因调控网络及其细胞状态的工具[1]。当前SCENIC版本可支持人、小鼠、果蝇物种。
SCENIC workflow[1]
SCENIC分析包含三个步骤,分别基于3个R包实现:
(1)GENIE3,共表达分析。
(2)RcisTarget,基于转录因子靶基因的TSS位点上下游,是否具有该转录因子结合的motif富集,将靶基因区分为直接靶基因和间接靶基因,从而保留直接靶基因。
(3)AUCell,对每个细胞的调控子进行活性打分。
欧易SCENIC分析结果展示
Regulon活性热图
图片说明:行表示不同的调控子,列表示不同的细胞,颜色由蓝到红表示调控子的活性由低到高。
TF motif富集结果
某一细胞类型中Regulon的特异性排序图
图片说明:横坐标表示排名,纵坐标表示RSS特异性得分。排名前三位的Regulon以红色点表示。RSS越高的调控子可能与该细胞类型特异性相关。
所有细胞类型中Regulon的特异性分布热图
图片说明:行表示不同的Regulon,列表示不同的细胞类型。颜色由蓝变黄表示RSS特异性得分由低到高,分值越高表示Regulon在该细胞类型中表达越特异。
Regulon关联特异性指数(CSI)聚类图
图片说明:行列均为Regulon,颜色由蓝变黄表示CSI值由低到高,CSI值较高的Regulon之间可能具有相似的细胞功能,共同调控下游基因。
各类群中Regulon数目分布图
图片说明:横坐标表示根据CSI聚类热图划分的CSI模块,纵坐标表示每个cluster中包含的Regulon数目。
各细胞类型中CSI模块的活性热图
图片说明:行表示根据CSI聚类热图中划分的CSI模块,列表示每种细胞类型。颜色由蓝变黄表示CSI模块的活性由低到高。活性相似的CSI模块对应的细胞类型可能具有相似的基因表达模式以及相似的调控网络。
案例分享
案例 · 1
早前,在Cell Report发表的题为Revealing the critical regulators of cell identity in the mouse cell atlas 一文中,通过对公共数据小鼠细胞图谱数据MCA[2]的Regulon调控子分析,鉴定出202个重要调控子,重构了小鼠主要细胞类型的基因调控网络,并将细胞类型特异的调控子聚类为8大模块,预测出每种细胞类型中的必需调控子[3]。
图1 | 细胞类型特异性调控子分析[3]
对B细胞的调控子特异性评分(RSS)排序发现,Ebf1和Bcl11a是最特异的调节因子,它们也是公认维持B细胞身份的重要调节因子。
图2 | 调控子聚类模块热图[3]
根据关联特异性指数(CSI)将202个调控子聚类成8个主要模块(图2A)。其中最大的模块M7包含48个调控子,与免疫细胞类型密切相关,它们的靶基因富集到了许多免疫相关功能。M7可进一步分为5个子模块(图2B),这些不同亚模块与不同的免疫细胞类型和调控子活性有关。(图2C)。
案例 · 2
2020年2月13日在Cell发表的题为Single-Cell Transcriptome Atlas of Murine Endothelial Cells 文章中通过SCENIC分析显示,不同调控子在不同组织来源的内皮细胞中会呈现上调表达。例如,Foxq1和Hoxd9调控子分别在大脑和睾丸的内皮细胞中高表达,Foxf1调控子在肺部内皮细胞中高度富集,而Pparg调控子则在骨骼肌内皮细胞中富集[4]。
不同来源内皮细胞的Regulon热图[4]
总 结
Regulon调控子分析能够有效识别并确定维持细胞特性的重要调控子,构建不同细胞类型的基因调控网络。如此强大的分析利器,老师们是不是跃跃欲试了呢,赶快来体验一下吧~
参考文献:
[1] Aibar S, González-Blas C B, Moerman T, et al. SCENIC: single-cell regulatory network inference and clustering[J]. Nature methods, 2017, 14(11): 1083-1086.
[2] Han X, Wang R, Zhou Y, et al. Mapping the mouse cell atlas by microwell-seq[J]. Cell, 2018, 172(5): 1091-1107. e17.
[3] Suo S, Zhu Q, Saadatpour A, et al. Revealing the critical regulators of cell identity in the mouse cell atlas[J]. Cell reports, 2018, 25(6): 1436-1445. e3.
[4] Kalucka J, de Rooij L P M H, Goveia J, et al. Single-Cell Transcriptome Atlas of Murine Endothelial Cells[J]. Cell, 2020, 180:1-16.
欧易生物单细胞事业部简介
欧易生物是国内少数具备10x Genomics和BD Rhapsody™单细胞测序双平台的机构之一,在医学和农林方向提供专业的单细胞建库测序及分析服务,包括单细胞3’,5’基因表达分析、单细胞免疫组库分析(TCR/BCR)、单细胞ATAC分析、表面蛋白分析和空间转录组分析等。
欧易生物单细胞平台具有丰富的项目处理经验,每年成功处理单细胞样本上千例;专业的售后团队,数十位生信专家和研发工程师为您的项目保驾护航;资深的技术支持人员,优化课题设计,解读数据,让客户感受有“温度的”全面服务。
END
本文系欧易生物原创
转载请注明本文转自欧易生物
网友评论