美文网首页微生物16S/宏基因组/代谢组
文献(动脉粥样硬化代谢与微生物关系)

文献(动脉粥样硬化代谢与微生物关系)

作者: 苏可_7fe6 | 来源:发表于2019-07-19 13:43 被阅读0次

    Alterations in the gut microbiome and metabolism with coronary artery disease severity

    一.过程

    文章过程.PNG

    ①将161例冠心病患者随机分为稳定型冠心病(SCAD)组、不稳定型心绞痛(UA)组、心肌梗死组(MI)40例。
    ②我们构建了一个由274个OTU组成的共丰度网络,并将它们聚为24个共丰度组(CAGS),并识别出不同cad组之间显著不同的重要的CAGS。
    ③进行了一个“交叉比较方案”,以确定在不同的群体血清代谢物的特点。将血清代谢产物归纳为共丰度代谢模块,筛选出与cad表型显著正相关或负关联的干扰特征。
    ④鉴定肠道微生物组成、宿主代谢谱和主要cad表型之间的相关性分析。
    ⑤利用验证队列中最重要的CAGS和Metabotypes,对交叉验证的随机森林分类器的ROC进行了分析,对各个组之间(Con VS CAD, Con VS SCAD, SCAD VS UA, SCAD VS ACS, UA VS MI)进行分类辨别。

    二.结论

    ① 通过对160名冠心病患者和40名健康人进行多组学分析,发现肠道菌群和血清代谢物随着冠心病(CAD)严重程度发生变化;
    ② 确定了与CAD严重程度相关的29个血清代谢物模块;
    ③ 分析并鉴定了与CAD严重程度相关的肠菌CAG;
    ④ 特定菌群可能通过影响宿主的代谢途径,影响患者动脉粥样硬化严重程度;
    ⑤ 基于上述微生物和代谢物所构建的疾病分类器,不仅可以在另一验证队列中准确区分疾病与健康人群,甚至可以用于鉴别不同的冠心病亚组。

    三.方法

    1.全代谢组分析

    代谢1.PNG

    (1)使用SIMCA-P
    (2)多元统计分析方法,并用交叉验证模型的有效性
    1)PCA分析
    无监督算法,只有一个数据集,分类对数据没影响,不利于发现组间差异
    2)PLS-DA分析
    有监督算法,人为加一个数据集,减小组内差异,类似于PCA
    3)OPLS-DA分析
    将PLS中y数据集减少为只有一个变量,而这个变量在比较的两组中的值被设定为一个极大一个极小。因此将原始数据矩阵X中系统差异分为两个部分,一部分变量与回归矩阵Y线性相关,另外一部分变量与回归矩阵线性无关。
    具体为有两种主成分,即预测主成分(只有一个)和正交主成分(可以多个),将组间差异最大化反应在t1上,而正交组成分反应组内差异。
    (3)代谢组学单变量差异分析
    1)T检验:适用于两组样本方差齐性,常用火山图
    2)ANOVA:适用于三组以上样本各组样本方差齐性,常用趋势图
    (4)VIP:判断单个自变量在解释因变量时的重要性,衡量代谢物的表达模式对各组样本分类判别的影响,辅助标志代谢物的筛选。
    (5)通路富集分析
    运用HMBD、KEGG、LMSD等进行ORA\FCS分析
    (6)代谢通路可视化
    (6)化合物ID转化

    2.高含量血清代谢产物的聚类研究

    3.粪便样品中提取DNA和16S rRNA基因v3-v4区域测序细菌DNA

    制备了16S rRNA基因v3-v4区的测序文库。用Illumina miseq系统将纯化的产物按同等比例混合测序。

    4.测序数据分析

    (1)USEARCH v.8.0
    (2)RDP classifier
    系统差异分析,匹配测序深度的差异。
    (3)Qiime v1.8.0:
    α-和β-多样性分析。对香农指数、the observed OTUs, and Chao1 index 进行评价。利用归一化的TOU丰度表进行β-多样性分析,包括基于Bray-Curtis的主坐标分析、加权的unifrac和未加权的unifrac距离。
    (4)PERMANOVA
    检验统计学效应
    (5)Adonis检验
    计算我们收集到的每一个宿主因子所解释的变异。
    5.SparCC产生微生物群
    找到CAGs,并利用WGCNA进行Ward clustering algorithm。
    6.Spearman多关联分析
    用r计算CAGS、血清代谢物模块和临床参数之间的Spearman相关关系,用Wilcoxon秩和检验CAGS和cad相关代谢型的差异丰度。Benjamini-Hochberg控制FDR。
    7.随机森林模型进行特征选择
    利用CAGS模型和代谢物模型,将发现阶段样本随机分为训练集和测试集。对70%的样本进行随机森林分类器训练,并在R.中使用随机森林包对其余30%的样本进行测试,然后在该模型的基础上使用另一个独立的队列进行进一步的预测。我们在训练集中使用了十倍交叉验证。在最小交叉验证误差下,我们建立了一组最优变量集,最重要的变量建立了预测模型。当将较小的模型应用于测试集时,将其作为AUC进行性能测试,并利用pROC r软件包计算了ROC曲线的置信区间。

    参考
    (1)https://www.jianshu.com/p/e291250595b9
    (2)http://www.sohu.com/a/323169773_785442
    (3)https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6486680/#CR72

    相关文章

      网友评论

        本文标题:文献(动脉粥样硬化代谢与微生物关系)

        本文链接:https://www.haomeiwen.com/subject/yqdxlctx.html