IMUP and GPRC5A: two newly identified risk score indicators in pancreatic ductal adenocarcinoma
IMUP和GPRC5A:胰腺导管腺癌中两个新发现的风险评分指标
发表期刊: Cancer Cell Int
发表日期: 2021 Nov 24
doi: 10.1186/s12935-021-02324-w
期刊相关信息一、背景
胰腺癌在世界范围内一直是一种具有致死威胁性的恶性肿瘤。尽管精准医学快速发展,其他类型癌症的生存率有所提高,但目前胰腺癌的治疗状况仍然不佳,5年总生存率为7~9%,1年生存率低于20%,因为它对传统放化疗和新兴免疫疗法的反应有限。高死亡率使得明确探索癌症遗传事件从而开发新的更有效的分子靶向疗法成为当务之急。本研究旨在探索胰腺癌发展过程中潜在的相关基因,确定有希望的基因指标和可能的药物靶,从而提高胰腺癌患者的生存率。
二、材料与方法
1.数据来源
来自GEO数据库的五种cDNA表达谱GSE15471,GSE16515,GSE41368,GSE43795和GSE71989。
2.实验流程
(1)PAAD与正常胰腺组织中差异表达基因分析:GEO2R包
(2)GO和KEGG对PAAD中高水平不同表达基因的注释
(3)高水平基因簇的风险评分评估:SurvExpress
(4)Kaplan-Meier生存和Cox回归分析确定调节PAAD发生的关键基因
(5)关键基因的理化性质分析:利用GeneCards了解所选关键基因的基本遗传信息,并进行人类蛋白质图谱,探索PAAD中关键基因的基因细胞位置和基本表达情况,然后ProtParam和ProtScale分析基因的理化性质。
(6)关键基因的GEPIA表达验证:GEPIA用于初步验证PAAD中所选关键基因与正常胰腺组织相比的表达变化。
(7)关键基因与免疫细胞浸润的关联:TIMER2.0用于探索所选关键基因的表达与PAAD中免疫细胞浸润之间的关联。
(8)PAAD关键基因的遗传改变分析
(9)PAAD组织微阵列生产
(10)免疫组化 (IHC) 实验
(11)分析关键基因表达与PAAD临床参数之间的关联
三、实验结果
1.PAAD和正常胰腺样本中有22491个差异表达基因
结合五种不同的GEO cDNA表达谱来探索PAAD和正常胰腺组织之间差异表达基因,分别在GSE15471(图1A)、GSE16515(图1B)、GSE41368(图1C)、GSE43795(图1D)和GSE71989(图1E)中鉴定出17871、13660、6779、6003和17622个基因。除了在不同的表达谱中共有的基因外,最终共鉴定出22491个基因(图1F),为了更准确地研究基因的表达,根据差异水平将候选基因分为4组:|log2FC|<1,|log2FC|≥1,|log2FC|≥2和|log2FC|≥3,即各组基因的表达差异水平为<2倍,2~4倍,4~8倍,>8倍。
图1 多个GEO数据中PAAD和正常胰腺组织差异表达基因情况2.高水平表达改变基因主要位于胞外空间
为了探索每组差异表达基因的潜在生物学功能,进行了GO和KEGG分析。有趣的是,五组数据结果揭示了一个事实:<2倍基因主要位于细胞核,4~8倍基因主要位于细胞质中,>8倍基因倾向于位于细胞外区域(图2A-E)。这表明了基因表达的差异越大,它们的细胞位置往往越远离细胞核,这符合大多数功能基因在细胞核内合成并受各种模块化因子调节的生物学常识,核蛋白的微小变化可能会导致大量核外蛋白的变化。
图2 PAAD表达差异的细胞定位注释为了便于进一步的进行免疫组织化学(IHC)实验验证和潜在的临床应用,作者主要关注差异较大的8倍基因进行进一步分析。对487个>8倍的基因的进一步注释表明,总共有55个基因在至少3个表达谱中共享,这表明与正常组织相比它们在癌症中的表达更为显著(图2F),并且这些基因中有很大一部分是胶原相关调节因子,如COL1A1、COL1A2、COL5A1、COL5A2、COL10A1和COL11A1,与PAAD癌相关的成纤维细胞浸润有关,并直接影响患者无进展生存期(PFS)(图3A-F)。
图3 胶原相关基因与PAAD存活率之间的关联3.高水平基因的风险评分评估和生存分析确定预后指标
在初步了解了八倍基因的基本信息后,对55个基因进行SurvExpress风险评估,支持了其在PAAD发展中潜在的预后指示功能,一致性指数为77.36,风险组风险比为3.91,还对风险组的55个基因表达进行了研究(图4A-C)。
图4 风险评分评估和KM生存率确定候选关键基因为了进一步缩小候选基因的规模,使用基于GEO、EGA和TCGA数据的KM存活率和基于TCGA、MET500和CPTAC数据的Ualcan存活率两种方法,分析55个基因的总体存活率。结果显示,KM和Ualcan均发现有6基因与PAAD存活相关,即GPRC5A(图4D)、IMUP(图4E)、KYNU(图4F)、MSLN(图4G)、S100P(图4H)和SFN(图4I)。此外,多变量cox回归分析显示,肿瘤分级、GPRC5A表达和IMUP基因表达是PAAD发展的独立预后指标。
4.GPRC5A和IMUP基因的理化性质,表达在PAAD中异常增高
用ProtParam、ProtScale和蛋白质图谱分析方法解读GPRC5A和IMUP的理化信息。结果表明,GPRCGA蛋白由357个氨基酸组成,分子量为40.3KD,哺乳动物的半衰期为30h。GPRC5A的氨基酸组成包括29个带负电荷的氨基酸残基(ASP+Glu)和32个带正电荷的氨基酸残基(Arg+Lys),蛋白质的理论等电点计算为8.39。同时,GPRC5A的预测不稳定性指数为38.49,表明它是一种细胞稳定蛋白。ProtParam计算的疏水值的总平均值为0.310,这与ProtScale分析结果一致,该结果表明GPRC5A蛋白质的疏水性区域多于亲水性区域,表明它是一种疏水性蛋白质(图5A)。此外,蛋白质图谱分析的结果支持GPRC5A定位在质膜和细胞囊泡中(图5B)。
至于IMUP蛋白质,ProtParam显示该蛋白质由106个氨基酸组成,包含13个带负电荷的氨基酸残基(ASP+Glu)和21个带正电荷的氨基酸残基(Arg+Lys),估计的蛋白质理论等电点为9.73。IMUP蛋白的分子量为10.9KD,哺乳动物的半衰期为30小时,不稳定性指数为38.42,也是一种细胞稳定蛋白。ProtParam预测的IMUP蛋白质疏水值的总平均值为-1.372,ProtScale还显示IMUP蛋白质含有多个亲水区域,应归类为亲水蛋白质(图5C)。蛋白质图谱显示IMUP可能位于核质、细胞质和质膜中(图5D),表明其作为一种亲水性蛋白质参与多种信号通路的潜在生物学功能。
图5 与正常胰腺组织相比,PAAD 中异常 GPRC5A 和 IMUP 的表达增加GEPIA用于验证PAAD与正常胰腺组织中GPRC5A和IMUP基因表达的变化。结果显示,尽管GPRC5A基因在不同的人类肿瘤中表达不同(图5E),例如,与匹配的正常组织相比在肾透明细胞癌和肺鳞状细胞癌中的表达较低,但在大多数其他类型的肿瘤中,包括PAAD(图5F)表达显著高于正常组织。IMUP基因也是类似结果,尽管在多种人类肿瘤中的表达不同(图5H),但在PAAD中的表达明显高于正常胰腺组织(图5I)。
有趣的是,pearson相关分析显示这两个基因之间正相关,表明它们在PAAD发育过程中对类似信号通路的潜在调节机制(图5G)。生存分析表明,GRPC5A和IMUP均为阳性的患者生存率最差,其次是GPRC5A或IMUP阳性的患者,两种基因均阴性的患者生存率最好(图5J)。除了在线数据分析外,IHC以及对患者样本进行的qRT PCR实验的结果也验证了PAAD中GPRC5A和IMUP表达的异常增加。在PAAD组织微阵列上进行的IHC实验证实,癌症中GPRC5A和IMUP的阳性率(分别为74.6%和46.8%)远高于匹配的正常胰腺样本(均小于5%),进一步支持了PAAD中GPRC5A和IMUP表达的异常增加(图5K–O)。
5.其他类型的基因改变分析
除mRNA表达外,基于cBioPortal数据库初步探讨了GPRC5A和IUMP的其他变化,包括突变率、蛋白质结构变异和拷贝数变异。结果表明,GPRC5A基因在不同肿瘤中的变异类型不同,在多种人类肿瘤中有一定比例的基因突变、缺失和扩增。但在PAAD中,基因扩增是主要的改变类型,其比率显著高于缺失(图6A)。同时,尽管在人类肿瘤中发现了GPRC5A基因的多个突变位点,但主要在其他肿瘤中发现,如子宫内膜样癌、肺鳞状细胞癌和膀胱尿路上皮癌,未在PAAD中检测到GPRC5A基因突变。IMUP基因变异类型远少于GPRC5A基因,扩增是主要变异类型,在其他肿瘤中仅发现了少量缺失或突变,在PAAD中未报告任何一种(图6B)。GPRC5A和IMUP基因改变(除扩增外的所有类型的改变)的患者总体、无病和无进展生存率均低于未发生基因改变的患者,表明这些基因在癌症发展中的潜在价值。
图6 GPRC5A和IMUP基因变异与PAAD中免疫细胞浸润的关系使用TIMER评估GPRC5A和IMUP基因表达与PAAD免疫细胞浸润之间的潜在关联。然而结果显示GPRC5A基因表达与CD4+T细胞、CD8+T细胞、B细胞、NK细胞、单核细胞、巨噬细胞、树突状细胞或癌症相关纤维细胞浸润之间无显著关联(图6C-J)。在PAAD中IMUP表达和上述免疫细胞浸润之间也未发现显著关联(图6K-L)。
6.GPRC5A和IMUP基因在PAAD发生中的临床意义
图7 GPRC5A、IMUP表达与PAAD临床参数之间的关系另一项分析进一步验证了上述分析结果的一部分。从TCGA网站下载了182例PAAD样本的原始临床信息(与之前的多变量Cox回归分析使用的数据相同),结果验证了GPRC5A和IMUP基因表达随癌症分级增加而增加的趋势。然而,尽管晚期患者的基因表达更高,但由于III期和IV期患者数量有限,这种差异可能没有统计学意义。同时,未发现基因表达与其他因素(例如患者种族、年龄、性别或远处转移)之间存在特定关联,这与样本量有限有关。
四、结论
基于多个GEO数据库和生物信息学分析工具,确定了22491个基因,这些基因在PAAD中与正常胰腺组织表达不同,并突出了其中的2个基因:GPRC5A和IMUP作为癌症发展的独立预后指标,可能成为新的有用的临床药物靶点。
网友评论