了解人类中枢神经系统(CNS)细胞识别的分子基础对于确定不同细胞类型的功能及其对不同病理的敏感性至关重要。由于基因表达位于细胞同一性的根源,人类中枢神经系统转录组为这项任务提供了一个自然的切入点。然而,几乎所有人类中枢神经系统的基因表达研究都分析了由许多不同细胞类型组成的异质性组织样本。
因此,通常认为,这些样本中基因表达的细胞起源无法确定,而这需要从物理上分离细胞类型。虽然这种“自下而上”的方法很容易应用于生物模型,但由于其体积小、可达性有限和抗解离性,很难应用于成人中枢神经系统。
另一种方法是通过对大块组织样本进行整合基因共表达分析来估计单个细胞类型的丰度与转录本之间的协变(covariation )。这种“自上而下”的方法假设,生物复制样本中细胞成分的变化将推动在特定细胞类型中独特或主要表达的转录本的共同变化。与单细胞方法相比,这种方法基于对数十亿个细胞的聚合分析,因此可以对主要细胞类型的核心转录特征进行高度可靠的推断。
通过分析62个数据集的基因共表达关系,包括代表所有主要中枢神经系统区域和技术平台的bb0 7000神经典型成人样本,我们确定了星形胶质细胞、少突胶质细胞、小胶质细胞和神经元的一致转录特征。我们创造了一个叫做“保真度”的新指标,它量化了基因表达水平与所有分析样本中推断的细胞类型丰度之间的关系。对细胞类型表达保真度最高的基因具有高敏感性和特异性:
Gene expression fidelity. A gene has high fidelity for a cell type if its expression is sensitive (it is consistently expressed by members of that cell type) and specific (it is not expressed by other cell types). Expression levels of high-fidelity genes are therefore highly correlated with the abundance of distinct cell types in heterogeneous tissue samples.
让使用者透过以下两种方法,探讨人类中枢神经系统基因表达水平及细胞丰度的共变:
- CNS region / cell type search: The user can search by CNS region / cell type to retrieve the top 50 genes ranked by genome-wide expression fidelity.
- CNS region / gene search: The user can search by CNS region / gene to retrieve information about the associations of individual genes with major cell types, as well as top gene expression correlates.
目前支持21个广泛的中枢神经区域和4种主要的中枢神经细胞类型(神经元、星形胶质细胞、少突胶质细胞和小胶质细胞)。下面提供了带注释的使用示例。有关更多详情,请参阅本网站所附的刊物。
CNS region / cell type search
细胞类型搜索示例。人类中枢神经系统星形胶质细胞表达保真度排名前50位的基因(外轨),以及这些基因的相关信息(内轨)。车轮图(Wheel plots )可下载为pdf格式。根据特定CNS区域/细胞类型的表达保真度排序的完整基因列表,以及绝对表达水平,可以从轮状图旁边的链接下载为CSV文件。数据下载页面提供了所有CNS区域/单元格类型的完整表。
-
Expression fidelity (blue track) is a z-score that quantifies the extent to which the expression pattern of each gene was correlated with the inferred abundance of the cell type over all queried samples (in this example 7221 human CNS samples were included).
-
CNS expression (red track) is an average of the expression percentile ranks of each gene over all queried CNS regional datasets (in this example 62 datasets were included).
-
LoF intolerance (black track) is the probability that a given gene is intolerant to loss-of-function (LoF) mutations. Data are from the Exome Aggregation Consortium (ExAC).
-
PubMed citations (green track) is the number of citations in PubMed returned by queries for each gene symbol plus the name of the cell type (here, ‘astrocyte’).
-
PPI (interior lines) denote protein-protein interactions (PPI) from the STRING database.
提供查询特定CNS区域/基因后返回的数据示例。在本例中,CNS区域为“All”,基因符号为“CNP”。每个面板的含义解释如下图说明。
更多详细解释参见:http://oldhamlab.ctec.ucsf.edu/about/
网站怎么用?
- 选择一个脑区:
- 选择一个细胞类型:
- 出结果导数据
网友评论