这篇文章是2019年1月14日发表在Nature Immunology上的一篇文章:Reference-based analysis of lung single-cell sequencing reveals a transitional profibrotic macrophage,文章中我最感兴趣的点在于SingleR包还有它对应的分析网站,这给没有已知标志的cell类群的鉴定提供了方法。
摘要
文章使用单细胞RNA测序(scRNA-seq)来表征小鼠中博来霉素诱导的肺纤维化中巨噬细胞的异质性。通过参考大量转录组(SingleR)对scRNA-seq进行注释的新型计算框架能够实现巨噬细胞的亚群集,并揭示了疾病相关亚组,其具有介于单核细胞衍生的和肺泡巨噬细胞之间的过渡基因表达谱。这些CX3CR1 + SiglecF +过渡性巨噬细胞定位于纤维化生态位并且在体内具有促纤维化作用。由人类表达的基因直系同源基因特发性肺纤维化患者的样本中过渡性巨噬细胞上调。因此,我们已经确定了对损伤的纤维化反应所需的过渡性巨噬细胞的病理亚组。
背景
-
肺纤维化
由于缺乏有效的治疗方法和对其病因学认识不足,肺纤维化是一个特别棘手的临床问题。 最常见的形式,即特发性肺纤维化,中位生存期仅为3年,批准的治疗方法有限。 在多器官中纤维化的发病机理,考虑到成纤维细胞在诸如胶原的基质蛋白的沉积中的中心作用,研究重心集中在成纤维细胞活化上。然而,成纤维细胞活化和增殖的机制尚不完全清楚。
2.要研究什么,用什么研究
健康的成人肺含有两种类型的常驻巨噬细胞: 自我更新的胚胎来源的巨噬细胞群被称为肺泡巨噬细胞( alveolar macrophages )和存在于较大的大气道附近和小间隙的独立存在的一群间隙巨噬细胞(interstitial macrophages)。在纤维化的损伤模型中,单核细胞来源细胞被募集到组织部位并具有促纤维化作用。但是,这些细胞的多样性和机制由何而来,他们调解促纤维化作用尚未完全明白,部分原因是特定转录组子集的研究受到bulk sequencing方法的限制。因为scRNA-seq可以解决细胞群体内的多样性,我们推断它应该可以增强对巨噬细胞异质性的理解,并明确纤维化中功能分析的子集。
-
提出文章标题中的refrence-based 方法(也是我最感兴趣的地方)
单细胞分析的当前限制之一是没有用于识别除手动之外的细胞类型的普遍的注释方法,受到主观性的影响。作者开发了一种用于无偏注释以及scRNA-seq聚类的计算工具,称为SingleR(单细胞识别)。 SingleR通过与通过微阵列或RNA测序(RNA-seq)测序的纯细胞类型的参考数据集进行比较,为单细胞转录组分配细胞身份。(基于数据库中已有的RNAseq数据以及芯片数据,计算scRNAseq中细胞和RNAseq中sample的相关性)
结果
结果一:在已经公布的数据中验证下SingleR的效能
Reference data sets enhance annotation of scRNA-seq 参考数据集增强了scRNA-seq的注释
Reference-based annotation of scRNA-seq.a图呢解释了SingleR是如何工作的:首先就是找到reference 转录组的数据,先识别其中的variable gene(变异基因?不是很明白不过根据文章的意思是可以提高cell type鉴定的准确性);然后计算ScRNAseq中每个cell和reference中的sample(其实就是每个特定的cel type的样本)的相关性,找出跟你所要鉴定的cell比较相关的细胞类型,然后进行迭代,找到最相关的那类细胞类型。
b图呢就是选了一套公布的数据来验证下SingleR方法怎么样。
左上角的图是原先公布数据中的tsne图和右上角是用singleR跑出来的singleR score得分最高的几类细胞的表达情况。左下角的图是 SingleR注释的t-SNE图上显示单元标识的,发现可以标识出更细的细胞类型(DC 和macrophages细胞)来。 右下角的图是为了验证说通过对来自骨髓衍生公开芯片数据的GM-CSF培养的macrophages(GM-Macs)和DC(GM-DC)之间的差异表达的基因分别在macrophages和DC中各自高表达。
c图呢就是用公开发布的一篇PBMC的scRNA数据来进一步验证SingleR的可靠性。
c图最上方是原始数据的tsne图,中间是SingleR注释的tsne图,可以发现是可以分成四类细胞:CD8,CD4,B,CD16,然后每一类里面可以具体细分。最下方的图就是为了看下这些基因在对应细胞的表达情况,进一步证明SingleR注释的细胞还是挺准确的。
网友评论