美文网首页
文献阅读(5):Location and condition b

文献阅读(5):Location and condition b

作者: scdzzdw | 来源:发表于2023-06-12 13:02 被阅读0次
  • 标题:Location and condition based reconstruction of colon cancer microbiome from human RNA sequencing data
  • 发表时间: 2023/5/2
  • 发表期刊: Genome medicine
  • 关键词:结肠癌瘤内菌

摘要:

  • 提出了一种方法来检测人类 RNA 测序数据中的细菌信号,并将它们与肿瘤的临床和分子特性相关联。 该方法在癌症基因组图谱的公共数据集上进行了测试,并在一组新的结直肠癌患者中评估了其准确性。
  • 分析表明,肿瘤内微生物组组成与结肠肿瘤的存活率、解剖位置、微卫星不稳定性、共有分子亚型和免疫细胞浸润相关。 特别是,我们发现了 Faecalibacterium prausnitzii、Coprococcus comes、Bacteroides spp.、Fusobacterium spp. 和Clostridium spp. 与肿瘤特性密切相关。

概括:

  • 本文实施了一个计算工作流来从人类 RNA-Seq 数据中提取微生物读数,识别和消除实验污染,并量化肿瘤特性与物种水平微生物组组成之间的关联
  • 将工作流程应用于TCGA的结肠、肺、脑、头颈、卵巢、皮肤和乳腺肿瘤样本,以重建肿瘤特异性微生物组。
  • 该工作流程在推断微生物组组成方面的准确性在一个新的结肠癌患者队列中得到验证,在该队列中,我们通过两种独立的方法同时对肿瘤进行测序并量化细菌丰度。
  • 结果表明细菌组成与肿瘤的分子、临床和预后特性之间存在很强的关联,并强调了可能与它们相关的特定细菌种类。

方法:

  • 样本信息:
  1. 来自TCGA的3737个原发肿瘤和318个正常实体组织
  2. 招募的30个可切除结肠癌症患者。每个患者肿瘤和非肿瘤邻近区域的组织样本(距病理学家评估的肿瘤病变边界** 2 和 10 厘米**)。 样本进行了 RNA 测序(90 个样本)、16S rRNA测序(61 个样本)和细菌荧光原位杂交(FISH,10 个样本)。 从最终分析中删除了两个具有少量 RNA-Seq 细菌读数(少于 300 个读数)的样本。
  • RNA sequencing:总RNA,非PolyA富集RNA
  • FISH:靶向检测Akkermansia muciniphila和Faecalibacterium prausnitzii。通过图像中存在的 EUB 阳性信号和总细胞数 (DAPI) 的数量对 FISH 图像中的细菌计数进行归一化来计算数据。Spearman相关性比较FISH和RNA-Seq结果。
  • 16S rRNA Sequencing:V3-V4区域。RNA-Seq与16S的对比:通过对数据集进行子集化以仅包括两者之间的交叉属,然后对每个属进行 Spearman 相关性检验。为了了解稀有、低丰度的分类群(具有许多零丰度值)如何影响相关性,对两个数据集应用了流行率过滤,其中存在的属(即细菌相对丰度 > 0)高于样本数量的百分比阈值 在两个数据集中都保留了(0%、10%、20%、30%、40%、50% 和 60%)。
  • 微生物组重建工作流程:
  1. 微生物读数提取:我们应用基因组分析工具包中的 PathSeq,使用提供的参考基因组。 使用默认参数运行 PathSeq,对于每个细菌物种,我们使用 PathSeq 输出矩阵的“分数”值来评估细菌丰度:它们考虑到物种共享同源基因组区域。
  2. 基因组冗余调整:为了避免考虑与真实样本衍生的基因组区域共享基因组区域的未检测物种的细菌分数,只考虑了那些至少有一个明确映射读取的物种的细菌分数。 然后对细菌评分值进行样本内归一化,以便所有细菌物种评分总和为 100,作为按百分比缩放的细菌相对丰度的度量。
  3. 批次效应检测与校正
  4. 微生物组PCA:去除了所有分析样品中细菌相对丰度为零的物种。 在此之后,选择了具有最高标准偏差值的 1000 个物种。 PCA 中异常值的存在会改变结果,因此测量了样本之间的欧氏距离,如果一个样本与其他样本的 95%(或更多)距离最远,则它被认为是异常值并被移除。 移除异常值后,重新运行异常值识别方法以识别和移除更多异常值,直到无法检测到更多异常值。
  5. 肿瘤特性与微生物组组成的关联:为了测试 PC 与肿瘤特性之间的特定关联,运行PCA,并用 Wilcoxon 或 Kruskal-Wallis 检验分析将 PC 坐标的不同分布与亚组进行了比较。 还使用 Spearman 相关性检验测试了 PC 坐标与肿瘤特性值之间的相关性。 考虑了前 6 个 PC,因为它们可以解释所有测试癌症类型的重建微生物组总变异性的 10% 以上。 对于生存分析,将 PCA 的每个 PC 的绝对负载值最高的 PC 贡献物种(200 种)视为最高。
  • LASSO模型:为了测试细菌组成是否可以作为临床肿瘤特性的潜在生物标志物,使用LASSO逻辑回归机器学习模型来区分分期、MSI 状态、CMS 和所有 COAD 样本中正常细胞的百分比。 使用二元分类问题。 选择了 500 个具有最高标准偏差 (SD) 的细菌,然后使用SIAMCAT 包训练 LASSO 回归模型,使用 10 次重复的十倍交叉验证策略。 对交叉验证重复中的所有预测进行平均,以获得每个样本的单个预测,然后用于评估模型的准确性。 对于非恶性与肿瘤样本的分类,我们选择了 200 种具有最高 SD 的细菌,并在交叉验证期间按患者 ID 对样本进行分组,因为仅使用配对样本。
  • 通路分析:使用 HUMAnN 3.0分析,将通路丰度标准化为每百万拷贝数 (CPM)。 过滤掉了低丰度途径(低于第一个四分位数的丰度,左侧为 30.49 CPM,右侧为 27.02 CPM,CMS1 为 26.74 CPM,合并 CMS 为 31.27 CPM,高突变负荷为 26.18 CPM,低突变为 25.36 CPM 负担),然后认为比其他亚水平(例如结肠两侧)高至少三分之一的丰度的途径具有差异活性。
  • 生存分析:分别在前六个 PC 坐标上运行单变量 Cox 分析,并选择重要的坐标。 为了排除与 PC 相关的临床特性对生存的可能影响,在多变量模型中测试了选定的 PC 坐标及其相关特性,并检查 PC 是否仍然显着。 为了考虑不同尺度的属性,我们将连续属性缩放到 0-1 范围内。 我们通过对未被相关属性混淆的 PC 坐标运行 Kaplan-Meier 分析来进一步验证我们的结果(在这种情况下,我们使用原始 PC 坐标)。 为了将患者分为“高”和“低”组,采用了最大选择等级统计。 为了检测哪种细菌与复发概率相关,我们将单变量 Cox 分析应用于前 100 个细菌的批次校正值,这些细菌具有与复发概率相关的 PC 的最高负荷(PC4)。 然后我们通过多重检验校正 Wald 检验的 p 值,选择 q < 0.2 物种。

结果

表征微生物组的实验检测方法的比较

Figure 2
  • 比较RNA-Seq和16S rRNA Sequencing:过滤样本间prevalence高于 20% 的细菌属时,Spearman 等级相关性在显示出两种方法之间的良好一致性(Figure 2c;p = 0.004;单样本 Wilcoxon 检验,rs = 0.17;Spearman 相关性)。过滤的prevalence阈值越高,相关性越强。
  • 比较RNA-Seq和FISH:FISH 信号与 A. muciniphila(rs = 0.58;Spearman 相关;RNA-Seq 数据中的prevalence为 0.5)和 F. prausnitzii(rs = 0.21;Spearman 相关性;RNA-Seq 数据中的prevalence为 1)

结肠癌的细菌组成与临床和分子特性之间的关联

Figure 3
  • 对每种tumor,计算前六PC(共解释大于>10%的微生物组)。使用Wilcoxon, Kruskal–Wallis或者Spearman correlation test计算六个PC和临床因子之间的相关性。
  • 除了COAD(Figure 3a),其他类型基本无相关。
  • LASSO逻辑回归,鉴定与side, MSI和CMS相关的species
  • 微生物组的组成随 CMS 的不同而显着变化,CMS1 与不同的微生物组相关联(Figure 3b)
  • 免疫细胞相关(Figure 3c)
  • 肿瘤样本中检测到的细菌组成与肿瘤的两个分子特性之间的关联:频繁突变基因的突变状态(即驱动基因突变状态)和染色体数量异常(即非整倍体状态)
  • Cox分析前六PC与OS和DFS之间的相关性
  1. 单变量Cox发现PC4和DFS有显著相关
  2. 多变量Cox矫正其他因素,PC4仍保持显著
  • 根据 PC4 坐标将患者分为“高”组和“低”组,并应用 Kaplan-Meier 分析:PC4 坐标较高的患者复发概率较高
  • 相同分析显示,正常组织中微生物组和临床特性无相关
  • LASSO 回归模型,以根据重建的细菌组成对样本的状态(非恶性与肿瘤)进行分类,达到了 0.83 的 AUC,证实可以从样本的重建细菌组成中预测其恶性程度。

鉴定与特定癌症相关特性相关的细菌

Figure 4

思考:

全文都使用的前六PC轴进行相关性检验,为什么不适用adonis2进行整体相关性检验?

相关文章

网友评论

      本文标题:文献阅读(5):Location and condition b

      本文链接:https://www.haomeiwen.com/subject/adafydtx.html