美文网首页
纯生信分析系列 数据再挖掘都会,文章再挖掘奔溃

纯生信分析系列 数据再挖掘都会,文章再挖掘奔溃

作者: 概普生信 | 来源:发表于2020-12-15 09:40 被阅读0次

    很多粉丝会咨询如何在已发表的文章基础上继续深入研究,今天的分享就告诉大家如何利用之前的研究成果再发高分文章。这样的策略在思路枯竭的时候不失为一种聪明快捷的好方法。今天的文章发表于杂志Cancers(IF:6.126)

    更多生信分析问题 生信人

    更多意向咨询 (http://gaptechsxr.mikecrm.com/1vdMmqy)

    CANCERS/Cancers

    大类:医学 2区

    小类:肿瘤学 2区

    2018  IF=6.162

    2019  IF=6.126

    文章思路概述:研究人员使用先前文章报道的预测胰腺癌生物标志物的四基因评分,对自己患者数据和胰腺癌公开数据进行分析,发现该评分与胰腺癌临床侵袭性相关,并且可作为转移性胰腺癌治疗反应的预测生物标志物,所以来看看作者是怎么利用之前score再发CANCERS的!

    胰腺癌是最具侵袭性的恶性肿瘤之一,其5年生存率小于10%。大多数患者在诊断时出现转移性疾病,而且只有20%患有可手术切除的疾病。此时,选择病理切除会延长患者的生存率,但是从生物学功能上,如果能够找到可作为生存率预测的生物标志物,将很大程度上提高医疗救治率。A Novel 4-Gene Score to Predict Survival, Distant Metastasis and Response to Neoadjuvant Therapy in Breast Cancer这篇文章中,曾经报道一个新的四基因评分,可以反映乳腺癌细胞的增殖和转移,并可作为预后的生物标志物。而异常细胞增殖也被认为是胰腺癌侵袭的主要原因,所以,他们假设这四个反映细胞增殖的基因评分,也可以作为胰腺癌的预后标志物,并进行验证。

    验证数据选取:954名胰腺癌患者分别来自TCGA,cBioportal,GSE34153,GSE57495,GSE62452;GSE71729还有DepMap portal 下载的cell line data。其中TCGA作为发现队列,三个完全独立的验证组(GSE57495、GSE62452和GSE71729)分别分析了胰腺癌病人的病理转移,进攻性,免疫浸润性以及患者生存和可切除性。

    分析方法:GSEA和 MSigDB进行基因集的富集,xCell score(https://xcell.ucsf.edu/)评估转录组数据的细胞组分,进而分析肿瘤免疫微环境。四基因得分按如下公式计算:四个基因得分计算为(1.355X(expressionDOK4)) + (1.641X(expressionHCCS)) + (1.345X(expressionPGF)) +(1.232 X(expressionSHCBP1)) 通过颗粒酶A (GZMA)和穿孔素(PRF1)的基因表达量计算细胞溶解活性评分,干扰素-γ响应得分来自Thorsson et al.,文献所述。根据队列中位数,划分通路高低分score值。

    文中提到的先前研究显示,乳腺癌细胞增殖过程检测的DOK4、HCCS、SHCBP1和PGF四个基因表达,在TCGA不同类型癌症中4-gene score如下图1所示,其中score值在头颈部鳞状细胞癌(HNSC)中最高,其次是直肠和结肠癌(分别为READ和COAD)。胰腺癌的基因表达水平处于第10位。

    图1,各种癌症中四基因的评分情况

    由于这四个基因与乳腺癌细胞增殖相关,所以作者提出假设,假设也与胰腺癌的侵袭性相关。首先在TCGA和GSE62452队列中进行验证,发现与AJCC提出的癌症分期无关(p = 0.489和0.126)但都处于较高的病理等级(p < 0.001, p = 0.034)如图2A所示。接着,对于TCGA, GSE62452, 和GSE57495队列,研究了常见的细胞增殖marker -- MKI67基因的表达情况,图2B所示为四基因score和MKI67基因的表达,Spearman’s rank correlation coefficient [r] = 0.610, 0.761,and 0.690, all p < 0.01)。另外在转移性胰腺癌中和原发性胰腺癌中比较发现,在GSE71729中转移性肿瘤的4个基因得分最高同时MKI67表达也升高,在GSE34153队列中score值也高于原发性肿瘤(图2B,C所示)。发现提示胰腺癌的四基因评分与肿瘤的侵袭性有关。

    图2,四基因评分与细胞增殖和转移性胰腺癌的关系

    接着为阐明上述现象的形成机制,这里用TCGA、GSE62452和GSE57495队列,根据四基因score值中位数,将其分为两组,分别是score值高和score值低。使用MSigDB Hallmark基因集进行基因集富集 (GSEA) 分析,如图3发现四基因高score值是与细胞增殖相关基因集,并且也富集到了肿瘤侵袭性相关的基因集,如MTORC1信号,PI3K/AKT/MTOR信号等。这些结果表明,四基因评分不仅反映了细胞的增殖能力,而且还反映了胰腺癌其他肿瘤的侵袭性。

    图3,TCGA, GSE62452和GSE57495队列high-four-gene-score的胰腺癌基因集富集分析

    接着对于胰腺癌不良预后相关的通路进行研究,假设四基因分数与基因改变率高、通路信号增强等这些基因相关。使用gene set variation analysis (GSVA)对每个信号通路的激活进行量化。研究发现KRAS 和CDKN2A较高比例的改变时,四基因评分较高。但是TCGA队列中TP53或SMAD4不遵循此规律,图4所示(p = 0.006, p = 0.044, p = 0.059, p = 1.00)。在图4B的三个队列中的KRAS下调信号通路,P53通路升高,转化生长因子(TGF)- TGF信号通路和E2F靶点与四基因得分显著相关。表明这四种途径在这些肿瘤中都增强了。

    图4,四基因通路与KRAS、CDKN2A基因改变较多,KRAS、p53、TGF-、E2F靶向通路信号通路增强相关

    由于肿瘤免疫微环境可以影响细胞增殖和肿瘤的侵袭性,因此依然推测四基因途径与免疫浸润相关,利用xCell算法,发现四基因得分高的胰腺癌与较低的T细胞CD8+分数显著相关,这在TCGA、GSE62452和GSE57495组中一致(图5A;p = 0.037和0.002,p < 0.001)。其他类型的免疫细胞(CD4+记忆T细胞,M1和M2巨噬细胞和调节性T细胞)与四基因评分无关。另外GSEA发现,干扰素-γ响应基因集被显著富集,(图5B所示NES = 1.55 (FDR = 0.05), 1.18 (FDR = 0.32), 1.37 (FDR = 0.18))。这一结果与TCGA队列中,高四基因评分显著与细胞溶解活性评分(CYT)和干扰素-γ响应增高相关(图5C,p = 0.014和0.004)。因此,胰腺癌的高四基因评分与良好的免疫微环境相关。

    图5,在TCGA、GSE62452和GSE57495组中,四基因评分与肿瘤浸润免疫细胞和免疫功能评分的关系

    由于四基因评分与细胞增殖相关,而细胞增殖又与化疗的效果相关。继而推测四基因评分可预测胰腺癌的化疗反应。为了验证这个假设,使用原发和转移的胰腺癌中提取的细胞系,做多种化疗药物即gemcitabine, paclitaxel, doxorubicin, irinotecan 5-fluorouracil, oxaliplatin, sunitinib,和sorafenib处理,通过AUC评估四基因评分是否可做出预测。有趣的发现了四基因评分与伊立替康和索拉非尼在原发性胰腺癌细胞系中的AUC相关(图6;r = 0.587 ,p = 0.03)和r = 0.648 p = 0.02),与紫杉醇和阿霉素在转移性胰腺癌细胞株的AUC相关(r = 0.582 ,p = 0.02和r = 0.624 ,p < 0.01)。这些结果表明,四基因评分确实具有评估化疗反应的作用,可进一步在动物模型推广。

    图6,根据DepMap细胞系数据,四基因评分与多种药物的药物敏感性的AUC情况

    考虑到四个基因的得分与胰腺癌的侵袭性有关,作者假设四基因评分高的胰腺癌与较差生存率相关。在TCGA队列中,高四基因评分组与较差的无病生存期(DFS)、疾病特异性生存期(DSS)和无进展生存期(PFS)显著相关(图7A上;p分别为0.026、0.027和0.019)。在TCGA, GSE62452,和GSE57495队列中,高四基因评分与较差的总生存率(OS)显著相关(图7A下;p = 0.044, 0.048, 0.022)。前文提到,胰腺癌患者手术切除治疗方案较多,而切除后边缘阳性则很大程度上影响患者生存,作者猜测四基因评分高的胰腺癌更有可能存在阳性边缘(R1和R2)。为了验证这一假设,这里通过R0(病理边缘阴性)切除的成功率比较低四基因评分肿瘤和高四基因评分肿瘤。研究发现,TCGA队列中高四基因评分组与低四基因评分组相比,R0切除率更低 (图7B, p = 0.013)。虽然四基因评分在切除后达到R0的患者中没有生存差异,但是在TCGA队列切除R1或R2 (R1/2)的患者中,高4基因评分的肿瘤与较差的DSS显著相关(图7 c、p = 0.477, p = 0.027)。四基因评分可以作为R0切除术的预测标志物和胰腺癌的预后标志物,特别是在侵袭性的边缘阳性胰腺癌(R1/2)。

    图7,四基因评分与胰腺癌患者生存率和手术切除情况的关系

    值得一提:

    研究利用先前文章中提到的乳腺癌基因评分,进行了胰腺癌队列的验证,四个基因评分在胰腺癌中判定了较差的生存率,并且有可能作为转移性胰腺癌R0切除术和治疗反应的预测生物标志物。评估四基因评分的程度可能是未来一种有价值的预后预测工具。

    更多生信分析问题 生信人

    更多意向咨询 (http://gaptechsxr.mikecrm.com/1vdMmqy)

    相关文章

      网友评论

          本文标题:纯生信分析系列 数据再挖掘都会,文章再挖掘奔溃

          本文链接:https://www.haomeiwen.com/subject/pxbigktx.html