基于lncRNA的胰腺癌预后风险评估因素
描绘跨泛癌水平的生物学功能
这次小编为大家解读一篇涉及泛癌和免疫的lncRNA研究文章,这篇文章利用lncRNA的表达构建预后模型,识别到与胰腺癌显著相关的lncRNA,并对关键的lncRNA进行泛癌水平的分析,检验他们与免疫的相关性,本文还有一个新奇的部分就是利用TCGA泛癌表型数据和lncRNA表达构建了人体解剖热图,值得我们学习。
“基于lncRNA的胰腺癌预后风险评估因素描绘跨泛癌水平的生物学功能”于2021年6月发表在Frontiers in Cell and Developmental Biology杂志上,影响因子6.684。
对临床写作来说 性价比更高的分析方向 热点泛癌研究生信分析意向表
研究背景
胰腺癌的早期研究取得了一些进展,已经发现了几个胰腺癌相关基因。然而,对胰腺癌潜在机制的全面了解仍然有限。最近的研究表明,lncRNAs可能提供新的见解并有助于进一步的胰腺癌研究。
多项研究描述了一些lncRNA对胰腺癌患者预后的影响,并建立了多种预后风险模型。然而,这些研究有几个缺点,包括数据样本、算法和疗效评估方面的局限性。此外,这些研究并未将其模型应用于泛癌研究或探索lncRNA的功能。
在这项研究中,作者旨在构建一个可靠的胰腺癌预后lncRNA模型和泛癌分析。共分析了TCGA数据中178名胰腺癌患者肿瘤组织的lncRNA表达谱,以及GTEx数据库中正常胰腺样本的基因表达数据用于校正非肿瘤和癌症样本数量的不平衡。对重要的lncRNA进行了泛癌分析,以探索lncRNA作为多种肿瘤预后分子标志物的可能性。
流程简介:
流程图研究结果
6-lncRNA的胰腺癌预后风险评分模型
为了识别与胰腺癌患者预后相关的潜在 lncRNA,作者使用来自 TCGA 和 GTEx 数据库的数据集作为组合数据集。对从训练数据中的组合数据集中分析的差异基因进行了单因素 Cox 比例风险回归分析。共获得112个与胰腺癌患者预后显著相关的lncRNA。在LASSO回归分析后,删除了具有高相关性或从属候选者的 lncRNA,并保留了 12 个具有高度独立性的生存相关的lncRNA。
图1 筛选与胰腺癌预后相关的lncRNA:(A)与胰腺癌预后相关的lncRNA的LASSO回归分析结果 (B) 预后相关 lncRNA LASSO回归分析中的交叉验证
基于来自组合数据集的训练数据集的多因素 Cox 回归分析筛选出六个预后 lncRNA。基于六个与生存相关的 lncRNA 构建了一个预后风险评分模型。
公式:
如图所示,在 6 个 lncRNA 中, AP005264.1 和 AC093895.1 的HR大于 1.0,表明它们是危险因素。AL590438.1、TSPOAP1-AS1、AC005696.1和Z92544.2的HR小于1.0,表明它们是保护因素。
图1:(C) 6-lncRNA 标记的风险比森林图基于6-lncRNA模型的生存预测模型构建
根据 6-lncRNA 预后风险评分模型计算了训练集中每个胰腺癌患者的分数。根据训练集中患者的中位数得分,将患者分为高危组和低危组。高危组患者的平均生存时间明显低于低危组患者的平均生存时间。Kaplan-Meier 分析表明,两组之间的总生存时间存在显著差异(图 2A)。训练组5年6-lncRNA模型的AUC达到0.804(图2B),表明预后风险评分模型预测了胰腺癌的5年生存率。在训练集中,胰腺癌患者风险评分、生存状态以及6个lncRNA在高、低风险组中的表达分布如图2C所示。
图 2 6-lncRNA 在训练集和测试集中的性能评估:(A) 高危组和低危组的生存曲线分析 (B) 6-lncRNA 的 5 年 ROC 评估曲线
(C) 患者风险评分、生存状态和 lncRNA 标志物表达谱
接下来计算了测试集中的中位数得分,并将测试数据集分为高风险组和低风险组。Kaplan-Meier分析表明,两组之间的OS存在显著差异(图2D),这与训练集中的结果相似。6-lncRNA 测试集中模型的 AUC 为 0.733(图 2E)。这些结果表明,预后风险评分模型在预测测试集中胰腺癌患者的 5 年生存率方面是可靠的。图 2F显示了高危组和低危组的风险评分、生存时间、死亡人数和 6 种 lncRNA 的表达情况。
图 2:(D) 测试集中高低风险组的 KM 分析 (E) 测试集中 6-lncRNA 标记的 5 年 ROC 评估曲线 (F) 测试集中的患者风险评分、生存状态和 lncRNA 表达谱胰腺癌患者的2-lncRNA预后风险评分模型及生存预测分析
作者在没有GTEx数据集的情况下对 TCGA 胰腺癌患者的整体数据集进行了生存分析。共有46个lncRNA与胰腺癌患者的OS显著相关。在单变量Cox比例风险回归分析后,获得了7个 lncRNA,将其输入多变量Cox比例风险回归分析。最后,获得了具有两种lncRNA的胰腺癌患者的预后风险评分模型。lncRNA MIR600HG和TSPOAP1-AS1的HR小于1.0,表明它们是胰腺癌预后的保护因素(图3A)。
图 3 2-lncRNA 的存活分析:(A) 2-lncRNA标记的风险比森林图使用2-lncRNA预后风险评分模型的中值,将TCGA胰腺癌患者样本分为高危组和低危组。Kaplan-Meier 分析显示高风险组和低风险组之间的 OS 存在显著差异(图 3B)。此外,模型5年的AUC为0.751(图3C),表明2-lncRNA标志物在预测测试集中胰腺癌患者的5年生存率方面具有可靠的性能。
图 3:(B) 2-lncRNAs 高低风险组的 KM 生存曲线 (C) 2-lncRNAs 五年存活率的 ROC 曲线在高危组和低危组之间,对预后风险模型中的两个 lncRNAs 进行排序,并在风险评分、总生存时间和生存状态方面进行比较(图 3D)。
图 3:(D) 2-lncRNA 高低风险组的比较预后风险评分模型中与关键 lncRNA 相关的基因
从胰腺癌的所有基因表达谱中,获得了19,658 个蛋白质编码基因PCG 和 14,142 个非蛋白质编码的lncRNA。标准化后,获得了16,988个PCG。在来自两个模型的 lncRNA 中,选择lncRNA TSPOAP1-AS1 和 lncRNA MIR600HG。对于这两个关键的lncRNA,与胰腺癌患者的标准化PCG表达数据集一一进行了Pearson相关分析。总共获得了1673 个与 TSPOAP1-AS1 相关的 PCG 和 2172 个与 MIR600HG相关的PCG。
与TSPOAP1-AS1相关的PCGs富集到27个GO terms,主要涉及7个功能(细胞外基质、蛋白质桥接等)。KEGG通路分析显示PCGs主要富集于免疫细胞活化、抗炎反应等5条通路(图4A)。
图 4 TSPOAP1-AS1 和 MIR600HG 相关基因和功能富集:(A) TSPOAP1-AS1相关基因的GO富集和KEGG通路富集
MIR600HG 的相关PCG 显示出 28 个富集的 GO terms,主要集中在五个生物过程和功能上(嘌呤核苷代谢、尿苷环化酶激活等)。KEGG 通路与白细胞迁移、癌组织蛋白多糖调节等有关(图 4B)。
图 4:(B) MIR600HG相关基因的GO富集和KEGG通路富集这两个lncRNA也参与了泛癌的多种癌症相关通路。使用GSEA分析发现,在胆管癌中,TSPOAP1-AS1参与淋巴细胞活化、B细胞活化、免疫细胞信号转导受体调节和免疫效应反应调节等生物学过程,而MIR600HG则负调节一些细胞信号通路如甲基化 CpG 蛋白调节、DNA 转录因子结合和 RNA 聚合酶结合等。
非癌组织和泛癌中的 lncRNA 基因分析
基因在组织中与不同性别之间的表达存在差异。利用GTEx数据库中的正常人体组织基因表达数据和33种肿瘤类型的表型文件和关键lncRNA表达水平,构建了目标基因在组织中表达的健康人体解剖图。其中,作者对器官和性别进行了分类,并绘制了每个器官中靶基因lncRNA表达的医学解剖图。采用Wilcox统计检验计算lncRNA在33种癌症中的差异表达。一般来说,这两种 lncRNA在所有组织中都低表达。TSPOAP1-AS1在脾脏中表达最高,在脑和肺组织中高表达。男性肠道系统和女性长骨中TSPOAP1-AS1 的表达水平较高。MIR600HG 在肾组织中表达相对较高,而在肺组织、雄性肠道和雌性骨骼肌中表达水平较低(图 5A、B)。
图 5正常人体器官和泛癌的靶基因分析:(A) TSPOAP1-AS1 在男性和女性正常人体器官中的表达 (B)MIR600HG 在男性和女性正常人体器官中的表达
接下来检查了 33 种肿瘤类型的肿瘤组织和正常组织中两种lncRNA的基因表达。TSPOAP1-AS1在膀胱癌和10种癌症中显著升高或降低,在宫颈癌和肺腺癌中的表达也显示出显著差异。还检测到MIR600HG 在 10 种癌症中的显著差异表达,包括乳腺癌和结肠癌(图 5C)。
图 5 :(C) TSPOAP1-AS1 和 MIR600HG 在 33 个肿瘤中的表达差异根据 TSPOAP1-AS1KM 和 MIR600HG 的中位表达将患者分为高表达组和低表达组,并检查了 33 种癌症的OS。在 PAAD、LUAD、READ 和 THYM 等癌症中,高表达组和低表达组之间的 OS 存在显著差异,其中 PAAD 的差异最显著。在 MIR600HG 低表达和高表达组中,OV 和 PAAD 患者之间存在显著的预后差异(图 5D)。
图 5:(D) TSPOAP1-AS1 和 MIR600HG 在多个癌症患者中的生存曲线分析使用 lncRNA 的表达对 33 种癌症进行了 Cox 比例风险回归分析。TSPOAP1-AS1与HNSC和PAAD患者的预后具有显著相关性,是预后的低风险因素。MIR600HG 与 PAAD 患者的预后显著相关,也是一个低风险因素(图 5E)。
图 5.:(E) TSPOAP1-AS1 和 MIR600HG 风险比森林图在各种癌症中检测到高表达组和低表达组之间疾病相关存活率的显著差异,PAAD观察到高度显著性。
TSPOAP1-AS1 是 KICH 预后的高危因素以及其他癌症类型的低危因素。MIR600HG是PCPG预后的高危因素和其他癌症的低危因素。
COAD中TSPOAP1-AS1的表达检测到无病生存期存在显著差异,COAD和KIRP中TSPOAP1-AS1表达水平差异显著,是这两种癌症患者预后的高风险因素。在 LUSC、PAAD 和 PRAD 中观察到高和低MIR600HG 风险组之间的显著差异,并且在许多癌症如 PAAD 中观察到显著的预后差异,其中 MIR600HG 是 PAAD 和 THCA 的低风险因素。
在无进展生存分析中,高风险组和低风险组在各种癌症中都显示出显著的生存差异。两种 lncRNA 的高危组和低危组在 PAAD 中的生存率显示出显著差异。TSPOAP1-AS1是多种癌症的重要预后因素,其中TSPOAP1-AS1是UVM的高危因素。MIR600HG 是 PAAD 和 PRAD 等许多癌症的重要预后因素,其中 MIR600HG 是 PAAD 的低风险因素。
接下来对两种 lncRNA表达与33 种癌症类型患者临床分期之间的相关性进行了非参数 Kruskal 检验分析。TSPOAP1-AS1在HNSC、KIRP、LIHC、LUAD、SKCM、TGCT和THCA中的表达在临床分期上表现出显著差异,其中HNSC和LUAD表现最为显著。TSPOAP1-AS1的表达在HNSC临床I期和II期临床胰腺癌样本之间存在显著差异,III期和IV期临床胰腺癌样本之间的差异更大。在LUAD中,I期临床胰腺癌样本与II期和III期临床胰腺癌样本之间也存在高度显著差异,I期和IV期临床胰腺癌样本之间也存在显著差异。MIR600HG与KIRC、PAAD及10种癌症的临床分期存在统计学显著相关性;MIR600HG的表达在KIRC III期临床胰腺癌样本和IV期临床胰腺癌样本中具有高度统计学意义(图5 F)。
图 5:(F) TSPOAP1-AS1 和 MIR600HG 与各种癌症临床分期之间的相关性
获得突变总数以获得肿瘤突变负荷(TMB)并计算TSPOAP1-AS1和MIR600HG在每个肿瘤中TMB与其表达之间的Spearman相关系数。发现 TSPOAP1-AS1 在 THYM 和 PAAD中与 TMB 呈负相关,而 MIR600HG 在 PAAD中与 TMB 呈低负相关(图 5G )。
图 5:(G) TSPOAP1-AS1 和 MIR600HG 与泛癌 TMB 之间的相关性,蓝色值是相关系数的标度
接下来,对lncRNA和微卫星不稳定性(MSI)进行Spearman相关分析。MSI 数据来自 Bonneville 等人关于泛癌 MSI的研究结果。本研究通过计算肿瘤-正常组织配对样本中各微卫星位点等位基因的分布差异,取平均值作为肿瘤-正常组织配对的MSI评分值,计算出TCGA数据库中大部分肿瘤样本的MANTIS评分。TSPOAP1-AS1与大多数癌症类型的MSI呈负相关或没有相关性,而MIR600HG 在更多肿瘤中与 MSI 具有更高的相关性(图 5H)。
图 5.:(H) TSPOAP1-AS1、MIR600HG 和泛癌 MSI 之间的相关性,绿色值是相关系数的标度
lncRNA基因与泛癌肿瘤免疫的相关性分析
接下来分析了TSPOAP1-AS1和MIR600HG的表达与33个肿瘤的免疫细胞和基质细胞水平的关系。TSPOAP1-AS1 在 KICH、LUAD 和 STAD中与免疫细胞含量和基质细胞含量呈统计学显著正相关。TSPOAP1-AS1在BLCA、HNSC、KIRC、LUSC、MESO、SKCM和TGCT中与免疫细胞含量呈显著正相关,而在UVM中仅与基质细胞呈正相关。MIR600HG与KICH、LGG和SARC中的免疫细胞和基质细胞含量显著相关,但仅与TGCT中的免疫细胞显著相关(图6A)。
图 6. 泛癌靶基因与肿瘤免疫的相关性分析:
(A)TSPOAP1-AS1、MIR600HG与泛癌免疫细胞和基质细胞含量的相关性
TSPOAP1-AS1的表达与7种癌症中10种免疫细胞浸润率显著相关。例如在ESCA中,如图,TSPOAP1-AS1与幼稚B细胞和调节性T细胞有关。
TSPOAP1-AS1与PAAD中记忆B细胞的含量也呈显著负相关,而MIR600HG的表达与DLBC、LAML、PAAD中初始B细胞的含量呈显著负相关并且与 LAML 中单核细胞的含量显著正相关 (图 6B)。
图 6 :(B)TSPOAP1-AS1、MIR600HG的表达与多种肿瘤免疫细胞浸润的相关性
TSPOAP1-AS1在23种肿瘤中均存在与其中度相关的免疫基因。TSPOAP1-AS1在15种癌症中与免疫基因BTLA呈显著相关,与PAAD和CHOL相关性强,其他主要显著免疫基因包括CD28和 CD40LG(图 6C)。
图 6 :(C) TSPOAP1-AS1、MIR600HG 和免疫基因在 33 个肿瘤中的共表达结果,蓝色代表 P 值,红色代表相关系数
MIR600HG 仅在 8 种肿瘤(CHOL、DLBC、GBD、LAML、LGG、PAAD、SARC 和 THYM)中与几种免疫基因显著相关;与 TSPOAP1-AS1 相比,该 lncRNA 与较少的免疫基因相关,且相关程度较低。
研究结论
lncRNAs在肿瘤中发挥关键作用,不仅是癌症预后的重要分子标志物,也是泛癌水平的分子特征。由于胰腺癌的预后较差,准确评估预后是制定胰腺癌治疗方案的关键。在这里,作者使用 Cox 回归和 lasso 回归分析了来自TCGA和GTEx数据库的胰腺癌数据,并使用两个数据库的组合以及仅TCGA数据库进行分析。构建了与胰腺癌生存率显著相关的预后风险评分模型,并研究了两种lncRNA。使用这两种 lncRNA 对 33 种癌症的分析表明,TSPOAP1-AS1 是 7 种癌症的预后标志物,其中胰腺癌最为显著,MI600HG 是卵巢癌和胰腺癌的预后标志物。TSPOAP1-AS1 与某些癌症的临床分期和肿瘤突变负荷以及许多癌症的免疫浸润强烈相关,而在多种癌症中观察到MI600HG与微卫星不稳定性之间存在很强的相关性。此研究结果有助于进一步了解lncRNAs在癌症中的不同功能,并可能有助于lncRNAs作为癌症预后因素的临床应用。
参考文献:The Biological Function DelineatedAcross Pan-Cancer Levels ThroughlncRNA-Based Prognostic RiskAssessment Factors for PancreaticCancer
网友评论