标题:Multi-regional characterisation of renal cell carcinoma and microenvironment at single cell resolution
预印本2021年11月发表于bioRxiv。
Introduction
许多分析已经表征了 ccRCC 的基因组landscope,揭示了重要的驱动事件,例如 VHL 的双等位基因失活(最常见的是伴随染色体 3p 的丢失和 VHL 中的突变/表观遗传沉默)。突变事件的肿瘤内异质性 (ITH) 是 ccRCC 的一个显著特征。
ccRCC 是一种免疫细胞大量浸润的癌症类型。免疫检查点阻断 (ICB) 治疗已被证明可有效提高患者的生存率
在考虑 TME 的异质性时,更广泛的感兴趣区域包括循环血液、肿瘤-正常界面或肿瘤假包膜(代表肿瘤与相邻正常肾脏之间的边界)、相邻正常肾脏和肾周脂肪组织。假包膜的纤维结缔组织似乎在空间上限制了生长,侵袭与肿瘤分期和分级相关。由于 RCC 中的肥胖悖论,肾周肥胖引起了人们的兴趣,其中肥胖是诊断肾癌的最强风险因素之一。
了解 ccRCC 在肿瘤细胞、各种免疫/基质细胞方面的空间异质性和进化,以及它们在更广泛的 TME 中的相互作用仍然缺乏。为了解决这一问题,对12名患者进行了基于多区域的scRNA-seq,采集了外周血、正常肾脏、肿瘤核心的四个不同空间区域以及肿瘤-正常界面,同时对激光捕获显微解剖(LCM)获得的肿瘤样本进行了局部详尽的外显子组测序。
Results
基于多区域的肾癌基因组和单细胞转录图谱分析
Fig1:肾细胞癌主要细胞类型的抽样策略及总体组织分布 FigS1:研究队列的基本信息和数据。对 12 名接受放射学诊断肾肿瘤手术切除的患者进行了多区域基因组和单细胞转录组分析。
12 名患者中有 10 名的肿瘤被评估为 ccRCC,1 名(PD47172)为嗜酸细胞瘤,1 名(PD44714)为大的良性厚壁囊肿。
在每位患者中,从外周血、正常肾脏、肿瘤核心的四个不同空间区域以及肿瘤-正常界面采集组织。如果有的话,从肾周脂肪、正常肾上腺、肾上腺转移和肿瘤血栓中取样组织。使用 10x 平台进行了基于液滴的 5' scRNA-seq 和 T 细胞受体 (TCR) 富集。同时,在执行全外显子组测序 (WES) 之前,使用 LCM 从每个含有肿瘤组织的区域解剖每个患者的微活检样本。根据 WES 数据,确定了在 ccRCC 中报告为复发/驱动事件的基因组改变。九名 ccRCC 患者中有七名(一名 ccRCC 患者没有数据)携带 VHL 突变,四名携带 PBRM1 突变,三名携带 BAP1 突变。在所有九名患者中都检测到染色体 3p 的拷贝数丢失。嗜酸细胞瘤携带整个 1 号染色体的特征性拷贝数丢失(单细胞 + VDJ + 外显子)。
FigS2:NK和B细胞室的空间和转录异质性。我们进一步对我们研究中涵盖的主要细胞隔间进行了亚聚类分析。NK细胞的亚群产生了14个具有差异表达基因(Degs)和不同来源组织的cluster。
在这些簇中,鉴定了众所周知的CD56(NCAM1)和CD16(FCGR3A)表达群体。
天然淋巴样细胞(ILC)cluster的特征是IL7R和FXYD7的表达。
两个NK cluster(cluster2和cluster6)显示高表达干扰素γ(IFNG),cluster6也高表达细胞因子CCL4L2,并可能在正常肾上腺中富集。
鉴定了一些特征较少的NK cluster,例如cluster 4,它特异性地表达KRT81和KRT86。这个NK细胞亚群以前在肝细胞癌中被报道过,但其功能尚不清楚。
B细胞被分类为13个cluster,其中确定了众所周知的主要 B 细胞群,如naïve, switched memory, and non-switched memory B cells。活化的 B 细胞(AREGhigh 和 RHOBhigh cluster)可能在肿瘤中富集,而 AREGhigh cluster在肾周脂肪中更富集。与外周血相比,血浆 IgA、IgG 和循环细胞(分别表达 IGHA1、IGHG1 和 MKI67)被发现在组织中富集。
CD8+ T细胞谱系揭示了进化轨迹和空间位置对衰竭的影响
Fig2:CD8+T细胞特性、克隆性、耗竭与区域富集[图片上传中...(image-ca8a63-1643290053995-8)]
<center style="box-sizing: border-box; margin-top: 0px; margin-bottom: 0px;">FigS3:T细胞室的空间异质性和转录异质性</center>
CD8+ T 细胞室的亚聚类导致鉴定出 18 个具有不同 DEG 和异质组织位置的cluster。
根据典型标记基因的表达确定了典型的 CD8+ T 细胞clusters,它们代表了不同的 T 细胞功能状态,包括幼稚、效应、记忆、前功能障碍和功能障碍。
发现高表达 LEF1 和 CCR7 等基因的幼稚/中枢记忆 (CM) CD8+ T 细胞主要在外周血中富集。
还鉴定了常驻记忆 (RM) T 细胞,因为它们表达组织驻留标志物(即 ITGAE 和 CD69),并且主要在正常肾脏中富集。
cluster 10 还高表达 CXCL13,它可能在 B 细胞募集和三级淋巴结构的形成中发挥潜在作用。
cluster 6 高度表达 FGFBP2 和 CX3CR1,并且在外周血中大量富集,因此该cluster可能代表最近激活的效应记忆 T 细胞(CD8+ T_EMRA)。
根据包括 LAG3、TIGIT、PDCD1、HAVCR2 和 CTLA4 在内的基因表达升高,确定了两个耗尽的 T 细胞cluster(cluster 7 和 8)。有趣的是,发现第 8 cluster具有最高的 LAG3 表达,并特异性表达免疫抑制细胞因子 IL10。该cluster可能代表具有极高效应子和功能障碍水平的 CD8+ T 细胞,它们通过产生 IL-10 发挥调节功能。
发现粘膜相关不变性 T (MAIT) 细胞高度表达 TRAV1-2 和 IL7R。鉴定出两个cycling细胞cluster:一个(表达MCM5和PCNA)代表细胞周期G1/S期的细胞,另一个(表达TOP2A和MKI67)代表G2/M期的细胞。
除了传统的CD8+T细胞簇外,我们还发现了两个γδT细胞簇:GDT_Vd1(表达TRDV1)和GDT_Vd2(表达TRDV2)
还对 CD4+ T 细胞群进行了子聚类分析,揭示了各种亚型,例如 CD4+ naïve/CM 和 CD4+ 调节性 T 细胞 (Tregs) 及其不同的组织分布。
使用 Monocle 3 和 RNA velocyto分析对除了γδT和cycling cluster之外的 CD8+ T 细胞进行了伪时间轨迹分析。沿着假时间轨迹,发现细胞毒性相关基因(即 KLRG1、GNLY 和 GZMH)逐渐下调,而功能障碍相关基因(即 CTLA4、HAVCR2 和 LAG3)逐渐上调。典型的 T 细胞功能障碍前相关基因(即 CXCR4、GZMK 和 GZMA)最初被上调,然后沿着假时间轨迹下降。因此,这个伪时间轨迹概括了 CD8+ T 细胞从细胞毒性状态经过功能障碍前状态到功能障碍状态的进展,同时耗竭程度逐渐升高。假时间和耗竭评分(exhaustion score)之间的正相关也支持这种进展。
将前 10 个扩展的 TCR 克隆型投影到轨迹上导致观察到单个 TCR 谱系通常仅限于类似的表型状态,而不是分布在整个轨迹上。在所有肿瘤中,发现 90% 的具有 23 个或更多细胞的克隆型被限制在假时间值范围内(Wilcoxon 检验,p < 0.05)。在多位患者中观察到每个克隆超过 100 个细胞的高度扩增的 TCR 克隆,其中显著高达 30% 的 CD8+ T 细胞可以源自单个克隆型。相比之下,与 CD8+ 群体中的 TCR 克隆型相比,CD4+ 群体中的 TCR 克隆型扩展较少。许多扩增最多的 CD8+ TCR 克隆具有相当比例的循环细胞,但在较少消耗的克隆型中观察到的情况除外。这一发现表明 RCC 中高度耗竭的 T 细胞的增殖并未完全停止。
无论克隆大小如何,平均耗竭程度(推断的假时间)和在外周血中检测到 CD8+ TCR 克隆的概率都具有很强的反相关性,以至于在血液中很少检测到耗竭的克隆型。这一发现出乎意料,表明组织驻留的耗竭 CD8+ T 细胞克隆似乎不会在外周血中再循环。
为了进一步说明 T 细胞耗竭、克隆扩增及其组织分布之间的关系,根据 CD8+ T 细胞是单细胞还是扩增以及它们的主要组织位置(血液、正常组织或肿瘤)对它们进行分类。肿瘤中扩增的 T 细胞进一步细分为出现在所有肿瘤区域的那些和不出现的(肿瘤同质和异质)。值得注意的是,CD8+ T 细胞的表型状态,就耗竭程度而言,显示出对克隆扩增和组织位置的强烈依赖(所有 p < 0.05,Tukey 检验)。同时,一个肿瘤区域私有的克隆并不比不同区域之间共享的克隆更耗尽(p > 0.05,Tukey检验)。
影响CD8+克隆型异质性的主要因素是空间定位,而不是肿瘤内的异质性
Fig3:体细胞突变calling及其与TCR克隆型异质性的关系使用从 WES 数据中调用的体细胞突变,构建了系统发育树来阐明肿瘤中的克隆进化和 ITH。
总体而言,所有肿瘤克隆共享一个长主干但具有短分支。这表明大多数体细胞突变在个体肿瘤中普遍存在,只有少数个体突变被检测到。
大多数检测到的驱动突变和关键 CNV(即 VHL 突变和染色体 3p 的杂合性丢失 (LOH))由单个肿瘤内的所有肿瘤克隆共享,因此位于系统发育树的树干上。此外,根据变异等位基因频率分布,测序的绝大多数 LCM 样本都出现了克隆性。综上所述,WES 显示数据队列中肿瘤的 ITH 范围是有限的。
先前的研究通过比较在来自肿瘤不同空间定位的样本中检测到的体细胞突变,广泛研究了各种癌症的肿瘤内遗传异质性。然而,体细胞异质性对不同空间定位的局部肿瘤微环境的影响,尤其是抗肿瘤免疫反应,在很大程度上仍不清楚。在这里,系统地比较了个体肿瘤中 CD8+ T 细胞的体细胞突变、空间定位和 TCR 克隆型之间的关系。
出乎意料的是,发现 T 细胞克隆型在不同的空间定位中具有高度异质性和差异性,即使在仅观察到体细胞突变异质性可忽略不计的肿瘤区域也是如此。
在肿瘤细胞上产生新抗原的体细胞突变被认为是抗原呈递时 T 细胞克隆扩增的驱动因素。分析表明 TCR 克隆扩增的异质性更多地与 T 细胞在组织中的不同空间定位相关,而不是与体细胞突变的 ITH 相关。
为了正式检验这一点,我们计算了 T 细胞克隆型距离与 1) 突变距离之间的相关性; 2)空间定位距离。通过比较这两种相关性,我们发现 CD8+ T 细胞中的 TCR 异质性与空间定位而非体细胞异质性的相关性更强(配对 Wilcoxon 检验,p < 0.05)。
从scRNA-seq数据中发现精确的从头开始的体细胞突变calling
FigS4:体细胞突变分析及其与TCR异质性的关系。从转录组序列检测单个细胞内的体细胞突变可能有助于推断它们的克隆关系。尽管理论上可以从 scRNAseq 数据中推断突变,但目前没有高精度的方法可用。在这里,开发了一种算法/pipeline来从 scRNA-seq 数据执行从头体细胞突变calling。
简而言之,在初始过滤步骤之前使用 bcftools 从单细胞 BAM 文件中调用突变,以去除单个细胞中存在的突变和不同细胞谱系之间共享的突变。在应用二项式过滤器之前,检查了初始步骤中调用的所有位点的参考和变异等位基因计数。然后,在对变体进行注释后应用了一组最终的过滤指标。为了对突变调用方法进行基准测试,首先比较了从肿瘤细胞的 scRNA-seq 数据调用的体细胞突变与从肿瘤 WES 数据调用的那些突变。所有检测到的突变都被归类为真阳性(由突变调用者检测到,或未被突变调用者调用但在原始数据中有足够的支持证据)、假阳性、假阴性或不确定(其中突变在没有足够的 WES 覆盖来验证呼叫)。总体而言,方法取得了良好的性能,精度为 0.64(仅考虑外显子突变时为 0.70),灵敏度为 0.53。还能够在 CD8+ T 细胞中对该方法进行基准测试,结果表明 84% 的被调用突变仅限于单个 TCR 克隆。这证实了预期的发现,即在 CD8+ T 细胞中调用的大多数突变仅限于克隆型,因为在胸腺成熟前 T 细胞克隆之间可以共享的突变数量非常有限。
使用这些突变调用,研究了不同细胞类型表达的突变数量,这可能有助于揭示它们的克隆扩增程度。计算了具有一个、两个、三个或三个以上突变的细胞比例。需要来自每个细胞谱系和患者的至少 100 个细胞来解释稀有细胞群中缺乏辨别力的问题。正如预期的那样,表达所谓突变的细胞数量最多的谱系是肿瘤细胞,这主要由谱系的已知克隆结构来解释,但也由于与正常细胞类型相比突变负担增加的可能性。出于类似的原因,基质细胞通常没有可辨别数量的细胞具有不止一种称为突变的细胞。然而,我们观察到大量表达突变的骨髓细胞,表明这些细胞中有相当大的比例是无性系相关的。随后是成纤维细胞和 CD8+ T 细胞(我们知道这些细胞是根据 TCR 测序结果进行克隆扩增的)。极少比例的 CD4+ T 细胞表达突变,与基于 TCR 分析的低克隆度一致。
髓系细胞种群的区域特征和进化
Fig4:髓系细胞的特征、区域富集和进化 FigS5:髓系细胞亚群分析一共鉴别了 50,603 个髓系细胞,在子聚类分析中将其分为 19 个clusters。首先根据marker的表达和细胞的组织来源对这些cluster进行了注释。
cluster 1、2、3 和 4 主要存在于血液中,CD14 高表达但缺乏 FCGR3A 表达,因此代表循环经典单核细胞。
cluster 5 代表循环非经典单核细胞,具有 FCGR3A 高表达但缺乏 CD14 表达。
确定了三个树突状细胞 (DC) cluster:pDC、1 型和 2 型conventional DC(cDC1 和 cDC2),分别以 JCHAIN、CLEC9A 和 CD1C 的特异性表达为特征。与其他区域相比,cDC1 在三个 DC cluster中显示出在肿瘤核心中的富集。
发现以 TPSAB1 特异表达为特征的肥大细胞可能在肿瘤核心中富集,这与之前的报道一致。
根据 CD163 和 C1QC 的高表达确定了 9 个巨噬细胞cluster(cluster 6-8、11-16),反映了 RCC 中巨噬细胞群的显著异质性。
继续对巨噬细胞进行亚群分析
为了进一步描述我们数据集中的异质巨噬细胞群,研究了9个巨噬细胞簇的DEGs和组织富集情况。
发现与其他正常组织相比,六个巨噬细胞cluster(cluster 11-16)优先富集在肿瘤核心/界面中,因此被定义为肿瘤相关巨噬细胞(TAM)。
其余三个cluster(cluster 6、7、8)在正常组织中富集,被认为是组织驻留巨噬细胞 (TR Mac)。
在六个 TAM cluster中,MHC-II TAM(cluster 14)高表达 HLA-DRB5、APOE 和 APOC1,与肿瘤-正常界面相比,肿瘤核心更富集。相比之下,其他五个 TAM 簇在肿瘤核心和界面中显示出相当程度的富集。
促炎性 TAM(cluster 11)高度表达趋化因子 CXCL9/10 和 NLRP3 炎症小体组装激活剂 GBP1/5,表现出 M1 极化的主要特征。
FN1+ TAM(cluster 15)高表达纤连蛋白 1 (FN1) 和scavenger receptor MARCO,此前曾报道其为肾癌中的特定巨噬细胞亚群。发现 FN1+ TAM 可能在 ccRCC 中促肿瘤,这反映在髓源性抑制细胞 (MDSC) 特征和 M2 极化基因的高表达上。
数据集中发现了一个 SPP1+ TAM cluster(cluster 16),该簇已在各种癌症类型中有所报道,但在肾癌中不存在。
分析发现 ccRCC 中的 SPP1+ TAM 表达了 GPNMB,并显示出与之前研究确定的 GPNMB+ TAM 高度相似。考虑到还确定了一个 GPNMB+ TAM cluster(cluster 15)并且可以在多个 TAM 簇中检测到 GPNMB 的表达,这一发现表明 SPP1+ TAM 可能代表 GPNMB+ TAM 的一个subset。除了表达 SPP1,发现 SPP1+ TAM 还表达 TREM2 并具有高血管生成评分。 TREM2+ 巨噬细胞与各种生物学和病理过程有关,例如肥胖和癌症。
在三个 TR Mac cluster中,TR Mac.2 高表达白细胞介素 IL1B 和表皮生长因子受体配体 AREG,这可能反映了其在体内平衡组织修复中的可能作用。
TR Mac.3,显示出SEPP1和MRC1的高表达并且在正常肾上腺中极其富集。 有趣的是,TR Mac.3 表现出极高的 M2 表达和吞噬特征,并显示出与促肿瘤 TAM cluster(即 FN1+ TAM)相似的通路激活。 在该数据集中,无法清楚地区分胚胎接种的组织巨噬细胞与单核细胞衍生的组织巨噬细胞.
接下来,探索了在研究中确定的不同 TR Mac 和 TAM cluster的潜在起源。使用 RNA 速率分析,发现从循环单核细胞到组织中的巨噬细胞有两个明显的定向流动:(1)经典 mono.3 到 TR Mac.2 和(2)非经典单核细胞到 TR Mac.1。 TR Mac.1 和 TR Mac.2 然后可能会在组织中产生其他巨噬细胞。为了确定巨噬细胞亚群与循环单核细胞的关系,利用体细胞突变进行谱系追踪,其方式类似于通过共享 TCR 克隆型确定 T 细胞表型状态的关系。在这里,构建了一个neighbour-joining tree来描述不同单核细胞和巨噬细胞簇之间的关系,利用从 scRNA-seq 数据调用的体细胞突变。分析发现循环单核细胞与组织中的巨噬细胞分离,与其他经典单核细胞相比,非经典单核细胞(cluster 5)与组织中的巨噬细胞显示出更密切的关系。数据支持代表循环单核细胞和巨噬细胞之间中间状态的非经典单核细胞,大多数巨噬细胞似乎来自单核细胞祖细胞而不是卵黄囊起源。
内皮细胞、成纤维细胞和上皮细胞的区域异质性
Fig5:内皮细胞、成纤维细胞和上皮细胞的空间和转录异质性数据集中观察到异质基质细胞群。内皮细胞 (EC) 的亚聚类显示 11 个具有不同 DEG 和组织位置偏好的cluster。
周细胞(cluster 11),以 RGS5 和 TAGLN 的表达为特征,优先富集在肿瘤核心中。
发现一个cluster(cluster 9)在肾周脂肪中极度富集,并高度表达 TFF3 和 PDPN,代表淋巴 EC。
其余 9 个cluster代表血管 ECs,其中cluster 10 代表循环 EC,高表达 TOP2A 和 MKI67。
确定了三个潜在的肿瘤相关 EC cluster:胶原蛋白 EC、IGFBP3+ EC 和 ACKR1+ EC,因为它们在肿瘤组织中显示出显著富集。在这三个cluster中,发现胶原蛋白 EC(表达 COL4A1 和 COL15A1)在界面中更加丰富,这可能通过细胞外基质 (ECM) 产生与其他细胞相互作用。 ACKR1+ EC 特异性表达非典型趋化因子受体 ACKR1,其支持免疫细胞的粘附和组织迁移。发现 IGFBP3+ EC 也表达高水平的免疫抑制酶 IDO1,暗示其在 TME 中的免疫调节作用。
发现 CRHBP+ EC 和 IGF2+ EC 优先富集在正常肾组织中,而 DNASEL3+ EC 显示在正常肾上腺中富集。
在sub-cluster分析中确定了九个成纤维细胞 (Fibro) cluster。
与 EC 类似,发现一组成纤维细胞(cluster 8)高表达胶原相关基因(COL1A1 和 COL6A2),并优先富集在交界面中。 这表明不同的产生 ECM 的基质细胞倾向于在界面中富集和共定位,发挥不同的功能,包括细胞外环境重塑和细胞间相互作用。 MMP 纤维的特征是基质金属蛋白酶 MMP2、补体因子 CFD 和 lumican LUM 的高表达。 发现 MMP 纤维富含肾周脂肪和肾上腺。 Cluster 7 高度表达 MYH11、SNCG 和 RERGL,因此被认为是平滑肌细胞 (SMC),如成纤维细胞。 发现 SMC 样纤维在正常肾组织中富集。
数据集中的正常上皮细胞群表现出预期的多样性,并在sub-clustering分析中分为 13 个clusters。
鉴定了两个近端肾小管 (PT) 细胞cluster(均表达 NAT8 和 PDZK1IP1):cluster 1 具有更高的金属硫蛋白 MT1H 和 MT1G 表达,因此可能代表 PT3 细胞,而cluster 2 可能代表 PT1/2 细胞,因为它表现出更高的PT2 标记 SLC22A6,以及 PT1 标记 SLC5A12 和 SLC5A2。
两个 汉勒氏袢 (LoH) cluster:cluster 3 代表升细肢 (ATL) 细胞,表达 CLDN3 和 TACSTD2;cluster 8 代表厚升肢 (TAL) 细胞,其特征在于 SLC12A1 和 UMOD 的表达。
确定了三个集合管 (CD) 上皮细胞cluster:A 型间质细胞(表达 SLC4A1)、B 型间质细胞(表达 SLC4A9)和 CD 主细胞(表达 AQP2 和 FXYD4)。
鉴定了特异性表达 SLC12A3 的远曲小管 (DCT) 细胞(cluster 7)、高表达 SLC8A1 和 CALB1 的连接小管细胞(cluster 10)、显示 PSCA 和 KRT17 特异性表达的盆腔尿路上皮细胞(cluster 13)和足细胞(cluster 11)专门表达 PTGDS 和 PTPRO。
肾癌表达meta-programmes 在肿瘤-正常界面显示不同的丰度,并影响预后
Fig6:肾细胞癌细胞表达程序、区域富集和预后 FigS6:肿瘤细胞表达程序为了探索肿瘤细胞群中的肿瘤内表达异质性,首先使用非负矩阵分解 (NMF) 定义了由每个肿瘤中的共表达基因组成的肿瘤内表达程序。这些表达程序代表了每个肿瘤中仅由肿瘤细胞亚群高度表达的基因模块,如代表性肿瘤 PD45816 中的 NMF 结果所示。
分析总共解剖了 10 个 ccRCC 肿瘤中的 45 个肿瘤内表达程序。其中一些程序虽然是个体肿瘤中的亚群事件,但被发现由不同的肿瘤共享,因此被定义为 ccRCC 中肿瘤细胞表达的meta-programme。通过聚类分析确定了六个meta-programme。
第一个meta-programme (MP1) 的特征是 FOS 和 JUN 等基因的表达,因此代表了肿瘤细胞中与应激反应相关的特征。
MP2 由近端肾小管 (PT) 细胞特异性表达的基因 (即 NAT8 和 ACSM2B) 组成。肿瘤细胞中 PT 特征的存在证实了先前的发现,即 PT 细胞是 ccRCC 的细胞类型。
发现第三个meta-programme (MP3) 富含 TGFBI 和 MT2A 等与上皮间质转化 (EMT) 相关的基因。这表明 MP3 可以概括 ccRCC 中的 EMT 过程,这在之前的 RCC scRNA-seq 研究中尚未报道。
MP4 由 NEAT1 和 HCG18 等非编码 RNA 基因组成,可能反映了一些压力或细胞死亡 (CD) 相关的细胞状态。
MP5 的特点是表达 MHC-II 相关基因,如 CD74 和 HLA-DRA。
MP6中发现TOP2A、MKI67等基因,说明该meta-programme与肿瘤细胞增殖有关。
接下来,整合了来自十个肿瘤的肿瘤细胞,通过去除批次效应来减轻患者间的异质性。通过sub-clustering和 DEG 分析,验证了肿瘤细胞中六个meta-programme的存在。计算了使用 NMF 破译的六个meta-programme的基因评分,并将它们映射到肿瘤细胞的 UMAP 上。这再次反映了在肿瘤细胞中亚群的meta-programme的表达。
有趣的是,发现 PT 和 EMT 程序的表达显示出反转模式,这通过在 TCGA 样本的bulk RNA-seq 数据中计算的 PT 和 EMT 分数之间的反相关性得到进一步证实。此外,与肿瘤核心相比,EMThigh 肿瘤细胞在肿瘤-正常界面(肿瘤的前沿)更丰富,这反映了 EMT 状态代表肿瘤细胞更具侵袭性和迁移性的事实。 PT/EMT 程序的异质表达与肿瘤细胞的空间位置偏好相结合,以个体肿瘤为例。例如,在肿瘤 PD45815 中,发现当通过 EMT 评分对肿瘤细胞进行排序时,PT 程序是反向表达的。同时,EMThigh肿瘤细胞倾向于定位在界面,而PThigh细胞相对更富集在肿瘤核心的R1和R2区域。最后,通过对 TCGA 样本的bulk RNAseq 数据进行评分,我现根据 TCGA 研究显示出最差预后的 TCGA 分子亚型 m3,与其他亚型相比,显示出显著更高的 EMT 评分但较低的 PT 评分。这一发现表明我们的meta-programme可以成为患者生存的潜在指标.
注:材料里写的是Gene scores of each metaprogramme were calculated as the average expression of genes in the specific programme. 但是EMT过程中的geneMarker是部分升高部分降低。因为在bioRxiv上看不到补充材料不知道作者的module到底纳入了哪些基因所以这个地方值得商榷。
与空间位置相关的细胞相互作用揭示了生物学的洞察力和有前途的治疗靶点
Fig7:ccRcc微环境中的细胞相互作用。为了探究RCC 微环境中不同空间位置的细胞间通讯,使用 CellPhoneDB 评估了正常肾脏、肿瘤-正常界面和肿瘤核心中主要细胞类型之间的细胞间相互作用。
有趣的是,肿瘤-正常界面和肿瘤核心中 12 种主要细胞类型之间发生的细胞间相互作用的数量相对具有可比性,即使排除了那些涉及肿瘤细胞的相互作用,其数量也比正常肾组织中的数量高出约两倍。
接下来,比较了在正常肾脏、肿瘤-正常界面和肿瘤核心的不同细胞类型上表达的特定配体-受体对介导的细胞-细胞相互作用。首先,该分析揭示了肿瘤与正常微环境之间相互作用的显著差异。例如,在 CD8+ T 细胞和 ECs 之间,发现 EC 募集(CCL5-ACKR1)和免疫抑制(LGALS9-HAVCR2)信号在界面和肿瘤核心中更加活跃,反映了肿瘤中血管生成和免疫抑制水平的升高。其次,始终观察到肿瘤边缘和核心之间的差异。例如,ECs 和 CD8+ T 细胞之间分别由 PVR-TIGIT 介导的潜在免疫抑制相互作用在肿瘤核心中更活跃,而细胞生长/迁移相关的相互作用 IGF-IGF2R 在肿瘤边缘中更活跃。第三,交界处的肿瘤细胞表达的转录本被预测为介导独特的细胞间相互作用,这可能潜在地促进肿瘤的发生。例如,在肿瘤边缘上,与肿瘤核心相比,髓系细胞表达增强的细胞迁移相关信号,该信号可以与肿瘤细胞(THBS1-Integrinα3β1)相互作用。
分析的结果表明,具有高 EMT 特征表达的肿瘤细胞(EMThigh肿瘤细胞)优先定位于肿瘤的前缘。这促使我们探索交界处是否存在任何可能促进肿瘤细胞 EMT 的活跃细胞间相互作用。使用 NicheNet分析(NicheNet可以预测配体活性,所以很多文章里都将NicheNet和cellphoneDB联合使用,从而达到最好的通讯分析效果)将来自 TME 中细胞的配体与肿瘤细胞中的 EMT 程序联系起来 。从该分析中,发现巨噬细胞表达的配体可能调节在肿瘤细胞上表达的大量 EMT 基因。特别是,巨噬细胞来源的 IL1B 对这些 EMT 基因显示出高度和广泛的调节潜力,可能是通过肿瘤细胞中表达的受体 IL1R1。有趣的是,发现 IL1B 由 TR Mac.2 特异性表达,其再次在肿瘤正常界面优先富集。总之,研究结果表明,表达 IL1B 的巨噬细胞 (TR Mac.2) 优先存在于肿瘤-正常界面,通过产生 IL1B 上调肿瘤前沿肿瘤细胞中的 EMT 程序。这种致癌途径可能最终促进肿瘤细胞的迁移和侵袭。
DISCUSSION
使用基于多区域的基因组和单细胞转录组测序来探究ccRCC 的表型异质性和多细胞生态系统特征。 总体而言,研究解析了 ccRCC 的 TME 的综合图谱以及 ccRCC 中的 ITH,包括肿瘤细胞和免疫/基质细胞的表型分类,以及它们在 TME 中的细胞间通讯,主要与它们的空间定位有关。
扩增的 CD8+ TCR 克隆型内的细胞在很大程度上受到耗竭评分的限制。最近在黑色素瘤中报道了类似的观察结果。克隆型的表型限制可能主要与给定克隆的时间成熟有关,而不是环境因素,因为个体肿瘤在完全不同的状态下都具有克隆型。除了表型限制之外,还发现扩增的 TCR 克隆型在一个或多个宏观肿瘤活检中也经常受到空间限制。由于研究中观察到的体细胞突变的 ITH 有限,因此无法通过暴露于不同的突变相关新抗原来完全解释 TCR 克隆扩增的这种空间限制。我们无法在 TME 中定义任何其他可以预测这种克隆型空间异质性的因素。感知到的 T 细胞克隆型的随机定位可能是物理和环境因素驱动细胞从外周循环到肿瘤驻留的初始迁移的结果。可以采用纵向取样策略或方法来确定准确的 T 细胞系统发育,以询问 T 细胞扩增和迁移的精确时间。对扩增 TCR 克隆区域限制的观察是否在其他癌症类型中更广泛地被发现,可能需要部署类似采样和测序策略的额外研究。
外周 TCR 用于非侵入性癌症检测和监测的效用显示出前景,尤其是在循环肿瘤 DNA 片段稀缺的 RCC 中。 虽然发现在血液和肿瘤区域都存在许多扩增的克隆型,但我们观察到衰竭程度与在外周血中检测到 TCR 克隆的概率呈负相关,以至于在血液中很少检测到衰竭克隆型。 这一发现表明,一旦 T 细胞克隆浸润到肿瘤中并经历从激活到功能障碍的表型转变,它们就很少再循环,这可能是由于 CD69 所证明的组织驻留表型。 因此,对肿瘤反应性 TCR 的外周采样更有可能检测到耗尽的肿瘤驻留克隆的前身,而不是那些目前在肿瘤中活跃的克隆。
开发了一种策略 (deSCeRNAMut),可以根据基于液滴的 scRNA-seq 数据准确检测不同细胞群中的体细胞突变。使用许多过滤指标(包括不同细胞类型谱系之间共享胚胎后突变的不可信性)消除了缺乏一致覆盖、低读取深度和容易出错的测序读取的主要挑战。检测到数据集中不同细胞谱系的体细胞突变,并确定了骨髓细胞中的高度克隆扩增。使用从这种方法调用的体细胞突变来构建巨噬细胞和单核细胞中的相邻连接树,以推断非经典单核细胞可能是肾癌中循环单核细胞和大多数组织驻留巨噬细胞之间的中间状态。设想在未来,使用空间成像技术来可视化一系列细胞类型中表达基因的突变,将有助于破译多细胞 TME 的系统发育组织。
EMT meta-programme是通过每个患者的肿瘤细胞亚群的表达来定义的,并且在研究中由多个 ccRCC 肿瘤共享。 更丰富的肿瘤细胞群和帮助规避具有挑战性的批次变化的方法的使用能够发现这个以前未报告的特征。 EMT 程序在 ccRCC 肿瘤细胞中的表达与 PT 程序(一种上皮表达特征)的表达呈负相关。 同时,ccRCC中的EMThigh肿瘤细胞倾向于定位于肿瘤-正常界面,这是肿瘤的前沿和迁移边缘。 这些发现与头颈癌的 scRNA-seq 研究中报道的结果相似,反映了 EMT 的定义特征:细胞中上皮特征的丧失有利于促进其迁移和侵袭能力.
分析细胞间相互作用揭示了与 ccRCC 的 TME 中不同空间定位相关的预测细胞间通讯的异质性。特别是,通过使用 NicheNet 连接配体和目标基因,发现 IL1B,由在肿瘤-正常界面 (TR Mac.2) 富集的组织驻留巨噬细胞亚群特异性表达,可能促进肿瘤细胞进行 EMT。据报道,IL1B 的表达与 RCC 的肿瘤分期呈正相关,并且与招募到癌症基因组图谱的患者中 RCC 患者的较差预后相关。此外,在 RCC 中抑制 IL1B 已显示在 RCC 的同系小鼠模型中诱导肿瘤消退。 IL1B 阻断剂也被证明可以减少动脉粥样硬化患者的肺癌发生率,目前正在几项临床试验中研究其使用。在我们的数据中,我们表明导致 IL1B 在 RCC 中不利作用的潜在机制通过巨噬细胞衍生的 IL1B 信号传导促进 EMT 起作用。利用这一途径可能在治疗上是有用的。
Methods
这个部分主要关注的就是作者的开发的基于单细胞数据的体细胞突变和基于TCR数据的谱系追踪
De Novo Mutation Calling from scRNA-seq Data
The code for this method is available at https://github.com/ThomasJamesMitchell/deSCeRNAMut
看了下是4个sh脚本,包含了4个步骤,scipt里面主要用的是R语言,输入数据是cellrange后的bam文件,具体内容是看不懂的,
Lineage tracing using scRNA-seq called somatic mutations
Lineage tracing using scRNA-seq called somatic mutations Based on the somatic mutations called from scRNA-seq data, we constructed a neighborjoining tree to elucidate the relationship of different monocyte and macrophage subtypes (the low quality cluster was excluded). Since our somatic mutations were called from gene expression data, we realized that the expression levels of genes may impact on the detection of mutations in different clusters, thus potentially making cell subtypes with more similar expression profiles cluster closer while those with less similar expression profiles segregate farther in the tree structure. To mitigate this, we excluded mutations that were detected in the top 100 DEGs of every cluster from the tree construction process. Based on the remaining mutations, we created a mutation matrix (mutation × subtype) considering whether a specific mutation appears in specific subtypes or not. Next, we calculated the binary distance between any two cell subtypes based on the mutation matrix and constructed the neighbor-joining tree using the‘NJ’ function in the R package‘phangorn’. A bootstrapping analysis was performed using the‘boot.phylo’ function implemented in the R package ‘ape’, with the number of bootstrap replicates being set as 100. The final tree structure was displayed using the‘plotBS’ function in the R package‘phangorn’
基于scRNA-seq的血统追踪称为体细胞突变基于scRNA-seq数据的体细胞突变,我们构建了一个邻接树来阐明不同的单核细胞和巨噬细胞亚型之间的关系(低质量的簇被排除在外)。由于我们的体细胞突变是从基因表达数据中调用的,我们意识到基因的表达水平可能会影响不同簇中突变的检测,从而潜在地使表达谱更相似的细胞亚型聚集得更近,而表达谱不太相似的细胞亚型在树结构中分离得更远。为了缓解这一问题,我们从树的构建过程中排除了在每个集群的前100个度中检测到的突变。基于剩余的突变,我们创建了一个突变矩阵(突变×亚型),考虑特定突变是否出现在特定的亚型中。然后,基于变异矩阵计算任意两个细胞亚型之间的二进制距离,并利用R包‘phangorn’中的‘nj’函数构造邻接树。使用R包‘ape’中实现的‘boot.phylo’函数执行引导分析,引导重复数设置为100。最终的树结构是使用R包‘phangorn’中的‘plotBS’函数显示的。
网友评论