美文网首页
纯生信6+肺腺癌必需基因分型研究

纯生信6+肺腺癌必需基因分型研究

作者: 概普生信 | 来源:发表于2021-06-23 10:24 被阅读0次

    Hi,小伙伴们,今天给大家分享一篇2021年4月28日发表在Cancers (IF=6.126),来自台北医学大学团队的文章(如图1)。这篇文章围绕肺腺癌中的必需基因展开,作者通过使用肿瘤必需基因来对生存结局不同的肺腺癌患者进行分层,并利用多个队列数据从终末呼吸单元类型中识别出一个具有不同增殖特征的亚组。

    文章背景:

    肺腺癌(LUAD)是非小细胞肺癌(NSCLC)的主要亚型,约占所有肺癌患者的40%。

    目前根据肿瘤样本中表达高度变异的候选基因,LUAD可以分为三种亚型,包括终末呼吸单元(TRU)、近端炎症(PI)和近端增殖(PP),但这样的亚型分层并没有考虑这些候选基因在肿瘤恶性肿瘤中的作用。

    Achilles项目使用一个基因组级的CRISPR-Cas9工具来逐个敲除每个基因,从而识别出对癌症生存至关重要的候选基因。

    文章数据及相关预处理:

    数据来自UCSC Xena (https://xena.ucsc.edu/;2019年7月20日)的TCGA LUAD患者(n = 511)的RNA-seq数据和临床信息,以及来源于GEO数据集的其他LUAD数据。

    TCGA和GSE140343 (n = 51) 的表达数据被归一化为每千碱基转录本的百万reads (FPKM)片段,然后进行log2转换。GSE68465 (n = 432)、GSE72094 (n = 398)、GSE50081 (n = 127)和GSE31210 (n = 226)数据集由芯片数据组成,通过稳健的多芯片平均和log2变换进行归一化。

    LUAD细胞的全基因组CRISPR筛选从DepMap网站下载(https://depmap.org/portal/download/;2019年7月20日)。

    使用CERES算法计算了大约17000个候选基因的依赖性得分。我们将CERES得分为1的候选基因定义为肿瘤组织中明显上调的必需基因。

    研究设计:

    本研究设计了一个分析管道来识别和描述LUAD患者的亚型、临床特征和分子谱(如图2)。

    (1)首先利用Achilles计划和The Cancer Genome Atlas (TCGA)的RNA测序数据进行全基因组规模的CRIPSR筛选,识别出LUAD的必需基因;

    (2)采用一致性聚类对患者进行分层,并与现有的亚型进行比较;

    (3)利用其他的独立数据来研究患者cluster之间的生存结局、基因组变异、信号活性和免疫谱。

    图2. 工作流程

    文章结果:

    一、识别能够促进LUAD恶性肿瘤的必需基因

    (1)为了查明LUAD恶性肿瘤的关键候选基因,作者研究了来自DepMap的全基因组功能缺失CRISPR筛选。在31个LUAD细胞系中,总共发现693个基因对维持生存至关重要。

    (2)为了确定693个基因中哪些候选基因在肿瘤组织中异常表达,作者用TCGA (59对) 和GSE140343 (49对) RNA Seq数据对肿瘤组织和配对正常组织进行了差异表达分析。693个必需基因中有36个在肿瘤组织中显著上调(如图3)。

    图3. TCGA和GSE140343的RNA测序数据中LUAD肿瘤组织显著上调的基因

    (3)基因表达相关分析表明,这36个候选基因在TCGA (中位数Pearson 's R = 0.625)和GSE140343(中位数Pearson 's R = 0.621)中均存在强相关性。这一发现表明,癌症必需基因是由共同调控子协调调控的(如图4)。

    (4)在功能上,通路分析显示这36个LUAD必需基因在细胞增殖信号通路中富集,包括DNA复制检查点、涉及G1/S过渡的转录和DNA复制起始(如图4)。

    图4. (C) TCGA数据中癌症必需基因的相关性 (D) 必需基因所富集的信号通路

    二、不同预后的LUAD患者的必需基因分层和E2F信号活性

    (1)使用36个已鉴定的必需基因进行无监督一致性聚类,将TCGA LUAD患者分为3个稳健类别,log-rank检验表明,这三个cluster具有显著不同的预后(p = 0.0039, 如图5A,B,C)。

    (2)多变量Cox回归分析表明,在TCGA LUAD患者中,必需基因分层亚型是一个独立于肺癌分期的预后因素(cluster 1 vs. cluster 3;危险比(HR) = 1.6, p = 0.039, 如图5D)。

    (3)LUAD必需基因的表达水平随后按cluster 3、 2、1的顺序增加(如图5E)。

    (4)为了确定与LUAD必需基因不同表达谱相关的中心调控因子,我们比较了这三个cluster的基因组改变。基因组突变和拷贝数变异分析显示TP53突变和染色体3q26.2扩增在聚类1中显著富集 (如图5F,G)

    图5. 必需基因不同cluster表现出不同的生存和分子特征

    (5)ssGSEA发现cluster 1中E2F靶点、G2M检查点和有丝分裂信号显著上调 (如图5H) 。此外,使用aREA来推断LUAD患者的TF活性,多个E2F转录因子(包括E2F2、E2F3和E2F4)的活性在cluster 1中显著升高。结合通路和转录因子分析的结果,这些聚类显示出不同的E2F活性,这三个cluster被表示为具有高(cluster 1)、中(cluster 2)和低(cluster 3)E2F活性。

    图6. 不同必需基因cluster具有显著不同的信号转导因子和转录因子(TF)活性

    三、从具有良好预后的TRU型患者中鉴定出一个新的必需基因亚群

    (1)根据506个候选基因表达,先前的研究将LUAD患者分为不同的分子亚型,包括TRU、PP和PI。TRU型患者预后良好,而PP、PI型患者生存率较差。三种必需基因cluster用于比较现有的分子亚型(如图7A)。

    (2)通过log-rank测试,属于cluster 3亚型的TRU表现出比其他分子类型更良好的预后(如图7B)。在不包含3cluster的TRU、PP和PI亚型患者中没有发现生存差异。此外,我们还发现,病变类型的患者显著富集了TRU - cluster3 (odds ratio= 36.86, p <0.001) 。从这些结果来看,必需基因提供了一个先前存在的LUAD分子类型的额外特征。

    图7. 必需基因分层cluster识别了具有不同增殖特征和预后的终末呼吸单元(TRU)肿瘤

    四、在多个队列中验证必需基因分层cluster的生存意义

    (1)为了验证必需基因分层cluster的突出作用,我们将TCGA LUAD患者作为训练集,使用最近的质心分类器建立预测模型。Log-rank生存分析显示,在GSE68465、GSE72094、GSE50081和GSE31210数据集中,cluster 1患者的预后明显较差,而cluster 3患者的生存率较好(如图8)。

    图8. 多套GEO数据必需基因分层cluster的生存和分子差异验证

    (2)尽管GSE140343数据集的必需基因分层cluster之间的生存时间没有显著差异,但它们的生存趋势仍然与其他队列相似。GSE140343数据集的生存差异不显著可能是由于样本量小(n=51)。此外,多变量Cox回归证实,在GSE68465、GSE72094、GSE50081和GSE31210数据集中,必需基因分层cluster能够作为把肿瘤分期作为协变量考虑在内的独立预后因素(如图9B)。

    (3)与TCGA数据类似,这些队列中约有一半的TRU患者属于cluster 1和cluster 2,显示出高的E2F信号和增殖信号(如图9C)。这些结果表明,LUAD必需基因是重要的分子预测因子,可以识别具有不同增殖特征和预后的LUAD患者。重要的是,这个特征可以进一步用于改进LUAD现有的RNA表达亚型。

    图9. (B)多因素Cox回归分析(C)必需基因分层cluster在之前已报道的表达亚型中的分布情况

    五、必需基因分层cluster的潜在药物发现和免疫环境特征

    (1)为了识别在关键基因分层cluster中表现出不同疗效的药物,将预测模型应用于GDSC数据库(如图10A)。比较cluster内药物反应的受试者操作者特征曲线(AUC)下的面积。GDSC数据库共包含367个化合物。只有257个化合物在超过75%的LUAD细胞系上进行了测试。

    (2)在cluster 1 LUAD细胞中,拓扑异构酶I抑制剂SN-38和poly(ADP核糖)聚合酶(PARP)抑制剂talazoparib的AUC显著降低(如图10B)。这表明具有高度增殖特征的cluster 1肿瘤容易受到靶向DNA复制机制的药物的影响。

    图10. LUAD必需基因分类cluster的药物发现和免疫特性

    (3)了解肿瘤中的免疫微环境和突变负担可以指导我们识别对免疫治疗敏感的肿瘤。因此,我们比较了TCGA和GEO数据集中必需基因分类cluster内这些因素的差异。ESTIMATE计算的免疫浸润评分在这些聚类中没有显著差异(如图10C),但TMB随后按聚类1、2和3的顺序下降(如图11D)。

    图11. LUAD必需基因分类cluster的免疫特性

    (4)先前报道的表达亚型表现出不同的免疫谱,TRU和PI亚型表现出比PP亚型更高的免疫浸润,TRU亚型中E2F靶信号活性较低(如图11E)。此外,对这些先前报道的具有基本基因分层簇的亚型进行分类导致了不同的E2F信号(如图11F)。

    (5)结合必需基因分层cluster和先前报道的表达亚型更全面地捕获了LUAD的增殖和免疫谱(如图11G)。PI型表现为高免疫浸润和高增殖特征;PP型表现为低免疫浸润和高增殖特征;TRU型分为高免疫浸润/高增殖组和高免疫浸润/低增殖组,预后明显。总之,E2F信号相关的必需基因可以识别具有明显增殖信号和预后的高免疫浸润性TRU患者。

    文章小结:

    该文章结合Achilles项目和LUAD患者RNA Seq数据,识别出36个参与细胞增殖途径的癌症必需基因。按照这些必需基因可以对LUAD患者进行临床分类,并结合先前所报道的亚型,可以更加全面地了解LUAD的免疫和增殖特性,比如具有高免疫浸润的TRU亚型可进一步分为低增殖和高增殖组。这些发现可以指导我们识别LUAD肿瘤的亚群,这些亚群可能在未来容易受到免疫治疗或细胞增殖抑制剂的影响。

    相关文章

      网友评论

          本文标题:纯生信6+肺腺癌必需基因分型研究

          本文链接:https://www.haomeiwen.com/subject/tuovyltx.html