美文网首页文章套路
生信分析 血管生成相关基因表达特征预测胃癌患者的预后

生信分析 血管生成相关基因表达特征预测胃癌患者的预后

作者: 概普生信 | 来源:发表于2020-12-29 09:17 被阅读0次

    首先让我们通过摘要了解下这篇文章的主要内容,研究表明血管生成在胃癌(GC)的发展和进展中至关重要。那么作者在本研究中旨在开发预后相关的血管生成相关基因(ARG)标志和列线图。数据来源于TCGA中提取的36个ARG的表达谱和372名GC患者的临床信息。通过共识聚类将患者分为聚类1簇和2簇。应用Cox回归分析识别与生存相关的ARG,并建立了预后基因标记。外部验证集来源于ACRG(n=300)。根据ARG标志的风险评分制定了预后列线图并且可以作为有效的预后生物标志物。

    更多生信文章https://biosxr.gaptools.cn/#/

     生信人 提供新颖正规、可复现的生信分析服务

    一.材料和方法

    1.1基因表达与临床数据采集

    从TCGA中下载了胃腺癌的基因表达谱和相应的临床信息,作为训练集,其中包含372例胃腺癌样本和35例相邻的正常腺癌。验证集来自于ACRG中的300名GC患者的数据。其中包括基因表达数据和随访信息(OS和DFS)。

    1.2共识聚类分析

    为了研究ARGs在GC中的功能,使用“ConsensusClusterPlus”将肿瘤样本分为不同的簇(50次迭代,重采样率为80%)。然后,使用PCA来验证使用R包“ ggplot2”进行聚类的可靠性。

    1.3基于ARGs的预后标志的开发和验证

    首先通过单变量Cox回归分析识别与OS相关的ARG,然后对这些预后相关的ARG进行LASSO回归分析。为了防止模型的过拟合效果,通过十倍交叉验证确定参数λ。根据最佳λ值和相应的系数,选择了十个ARG来建立风险特征。每位患者的ARG标志风险分数计算如下:

    根据中位风险评分将所有患者分为高危和低危组。最后,使用Kaplan–Meier分析来评估两个队列中高危和低危人群之间OS和DFS的差异。

    1.4构建和评估列线图

    利用R中的“ rms”包建立了列线图和校准图。通过ROC曲线确定列线图的预后性能。应用决策曲线分析(DCA)来评估临床实用性,并将建立的列线图与常规TNM分期系统进行比较,并将列线图与无ARG风险评分的图表进行比较。

    1.5基因集富集分析(GSEA)

    应用GSEA对高风险和低风险评分组之间差异表达的基因组进行富集分析。应用的是MSigDB C2 CP中的共1485个基因集。

    二.结果展示

    2.1基于ARG表达谱的聚类分析

    从GSEA(hallmark-angiogenesis)中下载ARG集,其中包括在致瘤血管形成过程中上调的36个基因。首先通过共识聚类分析ARGs在GC患者训练队列的预后意义,将样本分为两个簇。应用PCA证明了两组之间基因差异表达情况,无显著差异(图1)。同时,还分析了这两个簇中由TCGA鉴定的四种不同亚型的组成。与簇2相比,簇1中CIN和EBV阳性肿瘤的比例更高,而GS和MSI亚型则更少。

    图1. 基于TCGA队列中36个血管生成相关基因(ARG)的表达水平的两个聚类

    此外,作者测试了临床病理特征和分组之间的关联。结果发现聚类2的患者更可能患有较高级别的肿瘤,较高的T期,并且转移的频率明显更高。通过基因表达分析显示出与聚类1患者相比,聚类2患者中ITGAV,FSTL1,LUM,POTN,VCAN,COL5A2,COL3A1,TIMP1,SPP1和OLR1过表达(图2)。

    图2. 两种亚型的临床病理特征的热图

    生存分析显示,第1组患者的总体生存(OS)率明显高于第2组患者(图3)。

    图3.簇1和2的Kaplan–Meier生存曲线

    2.2识别预后相关的ARG并建立预后模型

    首先进行单变量Cox回归分析识别出了TCGA队列中的17种与OS相关的ARG。然后通过LASSO Cox回归分析进一步确定了十个基因用于构建预测模型(图4)。根据预测风险评分公式计算了每位患者的风险评分,并将训练集的患者根据风险评分中位数分为高危和低危组。Kaplan–Meier生存分析表明,高风险评分组的患者OS显著低于低风险评分组的患者。对5年OS的预测特征的ROC曲线分析显示AUC为0.750。

    图4. 血管生成相关基因(ARGs)的总生存率(OS)预测标志物的开发

    此外,针对TCGA队列中有关无病生存期(DFS)的预测价值,测试了上述预测风险评分。结果发现高风险和低风险评分组之间的DFS差异显著(图5)。2年DFS的ARG标志物模型的ROC分析显示AUC为0.673。

    图5. 基于10-ARG标志的TCGA队列中无病生存(DFS)的表现

    2.3使用外部数据集验证预后性ARG标志

    为了评估从训练集中识别出的ARG标志的预后能力,应用独立的数据集(ACRG队列)作为验证集。同样地,根据建立的预测风险评分公式计算验证队列中每个样本的风险评分并根据中位数将样本分为高低风险两组。结果显示高风险评分组患者的生存时间明显低于低风险评分组患者。

    图6. 验证集中ARG标志风险评分的预后表现

    2.4.ARG标志独立预测OS和DFS

    为了进一步确认ARG标志的新产生的风险评分是否是GC患者的独立风险因素,在这两个队列中均测试了各种临床病理参数。根据年龄,分期和风险评分的分界点将患者分为两组。在TCGA队列中,单因素分析显示年龄,性别,肿瘤分期和风险评分与OS显著相关(表1)。多Cox回归分析证明年龄,肿瘤分期和风险评分是OS的独立危险因素。此外,单因素和多因素分析表明,高风险评分与明显较差的DFS独立相关。这些由ACRG队列进一步验证。

    表1.胃癌患者总体生存和无病生存的独立预后因素

    2.5.基于ARG标志的列线图的构建和验证

    在这一部分,作者基于预测OS的训练集构建了列线图。列线图的综合临床病理特征包括年龄,性别,T期,N期,M期,淋巴结比率(LNR)和新产生的风险评分(图7)。根据ROC分析和C指数评估了列线图的预后价值。通过AUC曲线和决策曲线分析证明了列线图模型对预测3年和5年OS具有很高的准确性。

    图7. 建立,评估和验证列线图来预测胃癌患者的总生存期(OS)

    2.6.ARG标志的功能分析

    在这一部分,作者主要是对ARG标志物风险评分分组的高低风险组进行GSEA富集分析。根据与OS相关的ARG标志风险评分,高风险组的基因集主要富集与癌症相关的通路和转移相关的通路(图8)。

    图8. 基因集富集分析确定了与TCGA队列中的高风险评分相关的生物学通路

    好啦~这篇文章的内容就这么多啦,总之,该研究表明,所鉴定的ARG标志是GC患者OS和DFS的可靠预后和预测指标。此外,基于ARG的风险评分和列线图是独立的预后因素并且基于ARG的胃癌患者分层可能会提高临床试验的价值。

    更多生信文章https://biosxr.gaptools.cn/#/

     生信人 提供新颖正规、可复现的生信分析服务

    相关文章

      网友评论

        本文标题:生信分析 血管生成相关基因表达特征预测胃癌患者的预后

        本文链接:https://www.haomeiwen.com/subject/yoxfoktx.html