又是周五,工作的第一周,大家应该都上班了吧,时间总是不经意间从我们身边溜走,想抓也抓不住,今天给大家分享的文献在Single-cell transcriptomics reveals varying degrees of epithelial-mesenchymal plasticity in lymph node metastasis from oral cavity squamous cell carcinoma,单细胞目前处于狂热的跟风状态,大家还是要理智。
了解一些基础概念,Frequently used abbreviations
- CAF Cancer-associated fibroblast
- CNV Copy number variation
- DEG Differentially expressed genes
- DGE Differential gene expression
- EMP Epithelial-mesenchymal plasticity
- EMT Epithelial-mesenchymal transition
- GSEA Gene set enrichment analysis
- GSVA Gene set variation analysis
- HNSCC Head and neck squamous cell carcinoma
- KNN K-nearest neighbor
- MET Mesenchymal-epithelial transition
- MSigDB Molecular signature database
- OSCC Oral cavity squamous cell carcinoma
- PC Principal component
- PCA Principal component analysis
- pEMT partial EMT
- scRNAseq Single cell RNA sequencing
- UMAP Uniform manifold approximation and projection
- UMI Unique molecular identifier
核心两点
- 单细胞CNV的分析结果不一定就是CNV事件,也可能是反映了这些基因的高表达
- 转录因子的活性并不能仅通过其 mRNA 表达来很好地反映,因为它还取决于蛋白质稳定性和翻译后修饰
Abstract
扩散到区域淋巴结的口腔鳞状细胞癌 (OSCC) 与高度的上皮间充质可塑性 (EMP) 相关。在这里,对晚期异时性 OSCC 淋巴结转移的 1,946 个癌和 2,175 个基质细胞的 RNA 测序揭示了 OSCC 细胞在上皮间质转化 (EMT) 状态、代谢适应和细胞周期方面的异质性。七个细胞clusters形成了具有上皮分化、部分 EMT 状态和代谢适应的分支轨迹。值得注意的是,部分 EMT 与应激反应有关,特别是与 HSPA 上调、通过 CXCL14 的免疫调节和更高比例的增殖细胞有关,而上皮分化与更高的细胞角蛋白和激肽释放酶表达相关。虽然 EMP 相关转录因子 SNAI2 和 ZEB1 在所有癌细胞中都有活性,但TWIST1、SNAI1 和 ZEB1 的活性在上皮分支中更为明显。与部分 EMT 细胞相比,上皮分化细胞与基质细胞的受体-配体相互作用较少,表明其具有更独立的调节作用。有趣的是,轨迹主干内和附近的细胞适应低氧和低血糖条件,表达与糖酵解和氨基酸分解代谢相关的基因。
Introduction
口腔鳞状细胞癌 (OSCC) 属于头颈部鳞状细胞癌 (HNSCC) 的类别,初步诊断的 OSCC 的治疗方法是手术切除肿瘤,同时进行颈部清扫和放射治疗。 原发性 OSCC 有扩散到区域淋巴结的倾向,但只有少数患者发生远处转移。 原发性肿瘤的播散与上皮-间质转化(EMT)有关,而metastasis consolidation被认为与称为间质-上皮转化(MET)的逆过程有关。
EMT is an adoption of a developmental program,其中细胞获得迁移和侵入特性。细胞失去上皮细胞间的连接并获得间充质形态,伴随着转录、表观遗传和翻译后的变化。 EMT programs涉及胚胎发育和伤口愈合,还涉及癌症转移。 EMT 是一个多步骤过程,根据癌症类型和条件,有许多高度可变的替代途径。因此,EMT 标记基因、转录因子和基因表达特征的表达在患者之间、来自一名患者的不同病变之间以及在一个病变内的单个细胞之间是高度异质的。事实上,EMT 是一个连续、动态和可逆的过程,导致癌细胞显示出多种中间或部分状态。因此,最近有人建议将此 EMT 连续体称为上皮间充质可塑性 (EMP)。在转移级联过程中,细胞通过这个连续体进化,从上皮转变为更多的间充质或部分 EMT 状态并回到上皮表型。
大多数与 EMP 相关的单细胞研究都是基于受控的体外和体内实验,只有少数研究在新鲜分离的肿瘤样本中观察到 EMP。 尤其是对于 OSCC。 对来自 18 名患者的 2,215 个恶性细胞进行了表征,并发现了部分 EMT 状态,其中 80 个 EMP 相关基因表达具有高度可变性。 在这里,分析了从下唇粘膜 OSCC 的晚期异时转移中分离出的 1,946 个恶性细胞的综合单细胞 RNA 测序数据。 数据显示了单个转移灶内不同程度的 EMP,在不同方向和环境适应如缺氧、营养供应和可能的细胞-细胞相互作用。
Results
Patient and tumor characteristics(这方面我们就不展开了,这里需要注意一点的是CNV识别恶性细胞的用法,我们在方法中学习一下)
图片.png 图片.pngPhenotypic heterogeneity of tumor cell populations is characterized by specific gene expression patterns
在肿瘤细胞中,使用UMAP基于基因表达谱确定了七种不同的细胞群。这些群之间的关系通过一条分为两条曲线的轨迹来反映,该两条曲线主要遵循第一和第二PCA。 第一个 PC 中反映的变异主要由 EMP 相关基因驱动,例如波形蛋白 (VIM)、细胞角蛋白 (KRT17、KRT6B、KRT6A)、S100 蛋白 (S100A8、S100A9) 和基质金属肽酶 (MMP10)。 第二条曲线在细胞周期(例如,HMGB2、TUBB)、代谢(例如,ASNS、SLC2A1)和缺氧(例如,NDRG1)相关基因的表达上有所不同。 大多数恶性细胞在clusters 2、3 和 6 内紧密聚集在轨迹的中心,而其余细胞在其表达模式上表现出较大的变化,如 PC 和轨迹上的较大距离所示。
由于无法确定此类轨迹的开始和结束,我们估计 RNA 速度以使用剪接和非剪接 mRNA 计数的比率来预测单个细胞的短期未来发育方向。虽然轨迹中心的细胞没有显示出统一的发育方向,但来自第 4 组的细胞正在向第 5 组发展,采用进行性上皮分化,来自第 6 组的细胞向第 7 组发展,类似于细胞周期进程。确定轨迹方向的另一种可能性是癌细胞中遗传畸变的积累。推断的 CNV 揭示了向cluster 4 和cluster 5 发育的细胞在染色体 1、8、17 和 19 上的拷贝数增加频率增加。这些增益表明这些细胞在肿瘤进化过程中发育较晚。然而,应该注意的是,在 1 号和 17 号染色体上已识别的四个 CNV 中有两个与基因组接近的cluster 4 和 5 中上调的上皮基因相关。因此,这两个可能并不代表真正的基因组CNV,而是反映了这些基因的高表达。
图片.png图片.png
Epithelial-mesenchymal plasticity (EMP) drives heterogeneity of metastatic OSCC cells
不同肿瘤细胞群的基因表达模式反映了不同程度的 EMP、细胞周期和代谢适应。两个clusters(cluster 3 和 6)表达 8 个与部分 EMT 状态相关的基因,两个cluster(cluster 4 和 5)表达与上皮分化相关的基因,两个clusters(cluster 1 和 2)表达与缺氧反应或氨基酸代谢的代谢变化相关的基因,一个cluster(cluster 7)表达与细胞周期相关的基因。cluster 2、3、6 和 7 的大量差异表达基因 (DEG) 位于分子特征数据库 (MSigDB) 的 EMT 标志基因集中,并且已知有助于先前报道的部分 EMT 基因表达特征。这些clusters的细胞表达上皮和间充质基因的混合物,因此反映了 EMT 的中间状态。例如,间充质标记 VIM 在这些cluster中高度表达,并通过第二条曲线向clusters 6 和 7 增加,而 E-钙粘蛋白 (CDH1) 通常仅以低水平表达。因此,曲线 2 似乎反映了向更间充质表型的发育。值得注意的是,在肿瘤细胞中未检测到编码间充质标志物 N-钙粘蛋白(CDH2)和纤连蛋白 1(FN1)的 mRNA。部分 EMT 相关cluster 3 位于轨迹的中心,高度表达基质金属肽酶(MMP1、MMP10、MMP13),即与细胞外基质重塑相关的基因。该clusters的细胞还表达与免疫调节功能相关的基因,例如 CXCL14。此外,这些细胞的 DEG 富含参与 I 型干扰素反应的基因,例如 IFITM1/2/3,以及对压力的反应,例如热休克蛋白 (HSPA) 或压力相关转录因子 JUN/FOS。另一方面,向clusters 4 和 5 移动的曲线 1 反映了获得上皮特征的细胞,即富含角质形成细胞分化的 DEG。具体来说,clusters 4 的细胞表达经典的上皮标志物,例如 SPRR1B、KRT16、KRT6B、S100A7、S100A8 和 S100A9。随着上皮向clusters 5 的分化推进,KRT13、KRT15、PSCA 和激肽释放酶相关肽酶 KLK5/6/7 的表达增加。通过将上皮和部分 EMT 特征与来自 EMTome 数据库的更广泛的基因表达特征进行比较来确认基于基因表达的观察。
Gene expression patterns indicate differences in metabolic adaptation of OSCC cells
正如上面已经提到的,clusters 1 和 2 的特征在于与代谢变化基本相关的 DEG。具体来说,cluster 2 的 DEG 富含标志性缺氧基因,例如 NDRG1 和 EGLN3,其表达取决于氧水平。 NDRG1 调节应激反应和 p53 介导的半胱天冬酶激活。 EGLN3 通过脯氨酰羟基化在缺氧诱导因子 1 α (HIF1α) 调节中发挥重要作用。与肿瘤内指定的厌氧条件一致,糖酵解相关基因被富集和上调,例如 ENO1/2/3、ALDOA、PGK1 和 PFKP。此外,cluster 2 细胞中线粒体基因表达的百分比较低,表明线粒体活性较低导致氧化应激较少。然而,其他部分 EMT 相关基因也在缺氧反应clusters中上调,例如 SERPINE1、LAMB3 和 TIMP3。cluster 1 的 DEG 富含氨基酸代谢、response to starvation和 mTORC1 信号传导;后者是线粒体代谢的调节剂。这些基因包括 ASNS、PSAT1 和 PHGDH,它们将丝氨酸和甘氨酸代谢的代谢物整合到糖酵解中,因此用氨基酸促进糖酵解。因此,细胞似乎适应了低葡萄糖条件。
Cell cycle drives partial EMT cells towards a more mesenchymal phenotype
在曲线 2 上向clusters 6 和 7 progressing in cell cycle。 具体来说,clusters 6 富含进入 S 期的细胞,而 G2M 期的细胞在cluster 7 中占优势。这些clusters的这些细胞表达 VIM、CAV1、THBS1 和 MT2A,即与间充质表型相关的基因。 为了分析循环细胞的比例并排除细胞周期效应作为可能的混杂因素,我们在回归后重复了分析。 因此,确定了相似的细胞群和独立于细胞周期进程的轨迹。仍然确定了一个与细胞周期相关基因高表达相关的clusters,但这些细胞在 UMAP 上并没有形成一个统一的cluster。 通过 UMAP 划分细胞群并在特定细胞周期阶段计数细胞显示部分 EMT 细胞中增殖细胞的百分比最高,而上皮分化细胞中的细胞百分比最低。
图片.png图片.png
图片.png
图片.png
Epithelial differentiating cells have a distinct active transcriptional program
接下来,通过分析 EMP 相关转录因子 Zinc finger E-box-binding homeobox 1 & 2 (ZEB1/2)、Snail 和 Slug (SNAI1/2)) 的活性来表征肿瘤群体中 EMP 程序的调节和缺氧反应,Twist-related蛋白 1/2200 (TWIST1/2) 和 HIF1α。只有编码 SNAI2 和 HIF1α 的 mRNA 以可被ultiplexed s scRNAseq 检测到的水平表达; SNAI2 表达在 20% 的细胞中均匀分布在所有肿瘤细胞群中——除了第 5 cluster——而在 40% 的细胞中检测到 HIF1α表达。然而,转录因子的活性并不能仅通过其 mRNA 表达来很好地反映,因为它还取决于蛋白质稳定性和翻译后修饰;例如,ZEB1 比 SNAI1 更稳定。为了解决这个问题,使用带有 DoRotheEA(这个大家可以参考文章10X单细胞(10X空间转录组)转录因子活性分析之DoRothEA) 定义的调节子的 VIPER 算法,根据其靶基因的 mRNA 表达谱推断转录因子的活性。令人惊讶的是,尽管只能检测到 SNAI2 的 mRNA,但我们发现 ZEB1 和 SNAI2 的活性相似,但在分支轨迹上有一些变化。令人惊讶的是,cluster 4 和 5 中的上皮分化细胞显示出比其他细胞更高的 ZEB1、SNAI1 和 TWIST1 和更少的 TWIST2 活性。由于一些细胞表明对缺氧条件有反应,分析进一步研究了缺氧反应和 EMP 之间的可能联系。最初,EMT 和缺氧都被认为是促进侵袭和转移的独立事件。More recently, it was shown that the HIF pathway is interrelated with EMP, assuming a hypoxia-induced EMT。然而,虽然我们检测到 HIF1α mRNA 表达,但它似乎在 OSCC 细胞中并不真正活跃。
图片.pngPartial EMT OSCC cells have more interactions with stromal cells
除了 OSCC 细胞,还鉴定了成纤维细胞、内皮细胞、巨噬细胞和树突状细胞。至少确定了三个癌症相关成纤维细胞 (CAF) 以及成肌细胞样和内皮细胞亚群。 CAF1 showed high expression of fibroblast activation protein (FAP), which is low in CAF2 and 3. 相反,后者都高度表达黑色素瘤细胞粘附分子 (MCAM)。 CAF3 成纤维细胞表现出明显的 α 平滑肌肌动蛋白 (ACTA2) 基因表达,这是肌成纤维细胞的特征,以及白细胞介素 6 (IL-6)。IL-6 不仅发挥免疫调节功能,还能够促进 EMP 过程。有趣的是,CAF3 与成肌细胞样细胞紧密聚集,虽然缺乏成纤维细胞标志物(如胶原或 FN1)的表达,但表达了典型的成肌分化标志物,如 MYF5 和 MYF6。肿瘤浸润骨髓细胞形成 UMAP 上显示的三个树突细胞和三个巨噬细胞clusters。树突状细胞cluster 1 (dend1) 和巨噬细胞cluster 2 (macro2) 表现出高表达的应激相关基因,如 HSPA1A、HSPA1B 和 DNAJB1。巨噬细胞clusters进一步显示细胞因子和趋化因子的差异表达,例如 SPP1 (macro1)、CXCL10 (macro2) 和 CCL18 (macro3),表明它们的极化存在差异。
肿瘤微环境内的细胞-细胞相互作用显著影响各个细胞的特性。 不同细胞类型中配体和受体的表达使用 CellPhoneDB 推断可能的细胞-细胞相互作用。 大多数预测的相互作用发生在肿瘤和内皮细胞、肿瘤细胞和成纤维细胞以及成纤维细胞和内皮细胞之间。 有趣的是,上皮分化的 OSCC 细胞(cluster 4 和cluster 5)与具有部分 EMT 表型的细胞(cluster 3和cluster 6)相比,与其他细胞类型的配体-受体相互作用更少。 具体而言,发现 EGFR mRNA 在指定的肿瘤细胞中高度表达,这表明与表达相应配体(如 MIF、HBEGF 和 TGFB1)的细胞相互作用.
图片.png图片.png
Discussion
在上皮细胞引起的癌症中,一些肿瘤细胞具有间充质细胞的特征并失去其上皮特征。上皮间充质可塑性与癌症转移有关,这反过来又决定了大多数恶性肿瘤的预后。这些转变是如何发生的仍不完全清楚。在 EMP 期间,细胞可能会沿着连续变化谱从一种状态逐渐过渡到另一种状态,但也假定存在代表离散 EMT 状态的不同稳定、持久的细胞群。大多数检查 EMP 的研究显示出连续的转变,但这些研究基于体外系统或体内模型,可能无法完全反映肿瘤及其微环境的复杂性。不同的 EMT 状态是由多种微环境因素诱导的。事实上,已经在原位或离体描述了单个癌细胞表达上皮和间充质特征的部分 EMT 状态。此外,癌细胞的不同 EMT 状态与基质细胞相互作用的能力不同,这些不同的相互作用实际上可能稳定各自的细胞状态。在这里,通过 scRNAseq 对来自 OSCC 的异时淋巴结转移的深入体外分析。检测到病变内的肿瘤细胞群具有明显的异质性,其特征是专门的基因表达程序,反映了 EMP 连续体、代谢适应和细胞周期内的不同状态。根据它们的 mRNA 表达谱,这些亚群形成了七个clusters,它们向上皮分化、部分 EMT、代谢适应或细胞周期分支。轨迹主干中或附近的转移性 OSCC 细胞表达基因,表明对缺氧和低血糖条件的适应。虽然部分 EMT 与应激反应、免疫调节和更高比例的增殖细胞相关,但上皮分化与更高的细胞角蛋白和激肽释放酶表达相关。报道了以细胞角蛋白、激肽释放酶和 S100A8/9 基因表达为特征的上皮分化表达程序,这些基因表达与衰老相关表型相关;因此,解释了对上皮分化cluster内增殖较少的细胞的观察.
来自 EMTome 数据库的基因表达特征反映了 EMP 动态,因为它们与研究中观察到的部分 EMT 状态或上皮分化相关。事实上,在一个病变中观察到几个 EMT 状态强调了转移性生长可能需要的高度可塑性。 OSCC 肿瘤与此处描述的部分 EMT 相似。然而,与所提供的样本相比,研究可能反映样本内的细胞异质性程度较低,这可能是由于每个样本的测序细胞数量较少。表征部分 EMT 状态的常见基因包括,例如,MMP10、TGFBI、PDPN 和几种细胞角蛋白;所有这些都可以调节细胞外基质,因此可以增加癌细胞的运动性和侵袭性。此外,部分 EMT 表型可能与肿瘤生长有关,因为该群体的增殖细胞比例高于上皮分化细胞的比例。
除了先前发现的 SNAI2 表达外,ZEB1 在 OSCC 细胞中也很活跃,尽管我们无法检测到 ZEB1 mRNA 表达。 ZEB1 的高活性通常与 EMT 相关,因此上皮标志物如 E-钙粘蛋白 (CDH1) 的下调。然而,虽然 ZEB1 主要作为转录抑制因子,但它也可以诱导角质形成细胞分化标志物 SPRR1B 响应 IL-1β 和 IFNγ。 SPRR1B 在上皮分化细胞中高度表达,但在部分 EMT 状态的细胞中不表达,这可以解释推断的 ZEB1 活性。此外,参与 TGF-β诱导的 EMT 的 ZEB1、SNAI1 和 TWIST1 在 EMP 中具有不同的活性。分析样品中的 EMP 可能受 TGF-β 的调节,TGF-β 不仅在微环境中表达,而且可能相互作用在肿瘤细胞中高度表达EGFR。然而,通过 HIF1α 诱导 EMT 的缺氧相关机制也可能发挥作用。cluster 2 中的缺氧反应细胞群显示出 EMP 相关基因的上调,例如 SERPINE1、LAMB3 和 TIMP3。先前的研究还表明,LAMB3 在缺氧条件下上调;值得注意的是,LAMB3 表达与淋巴结转移和存活率降低有关。
此外,癌细胞对低葡萄糖条件的适应通过基因表达模式向更高的氨基酸代谢促进糖酵解来证明。 然而,虽然先前的研究也表明代谢相关基因表达在 OSCC 细胞中上调,但特定代谢途径的活性在患者之间存在高度异质性。 因此,需要进一步研究以充分了解 OSCC 中缺氧反应和代谢适应的异质性,包括直接测量代谢物浓度。
单个转移样本代表肿瘤进化特定时间点的snapshot。因此,所提出的基于 scRNAseq 的轨迹反映了肿瘤细胞群之间的发育关系,而不是通过进化过程。尽管如此,RNA 速度允许通过将测量结果与基因表达的潜在动力学联系起来,从 scRNAseq 数据中提取短期、定向的动态信息。在这里,我们发现了从cluster 4 到cluster 5 以及从cluster 6 到cluster 7 的明确方向,但在剩余clusters中没有明确的方向。因此,观察到正在进行的上皮分化和增殖,但不能断定恶性细胞是在转移灶内还是在原发性肿瘤内早期分化成异质群体。尽管如此,推断的 CNV 增益表明上皮分化细胞形成晚于部分 EMT 细胞,因此反映了经历的 MET。然而,部分 EMT 细胞可能驱动肿瘤进展,因为上皮分化细胞可能反映衰老表型。进一步假设同时具有间充质和上皮特征在部分 EMT 细胞中提供更高的可塑性,支持这些细胞可能分化为观察到的上皮或代谢适应表型。或者,如果构成各自clusters的细胞在原发性肿瘤内发育,则反映这种异质性的多个个体播散肿瘤细胞克隆将是构成转移瘤所必需的。
由于癌症进化构成了成功治疗的巨大障碍,因此需要进一步研究以揭示肿瘤细胞的进化过程并且已经出现。 整合来自转录组、基因组和翻译后修饰的数据——最好在单细胞水平和同一个体内——应该提供更好的肿瘤进化整体lanscope。 理想情况下,这还包括从血液和肿瘤引流淋巴结中富集的播散和循环肿瘤细胞,填补转移级联中的缺失部分。 这些见解将有助于了解 EMP 在局部转移发展和治疗反应中的作用,从而支持临床医生的治疗决策,例如,使用指示转移和复发风险的生物标志物。
Method
Trajectory, CNV, RNA velocity and receptor-ligand interaction inference
图片.png图片.png
生活很好,有你更好
网友评论