MM:多发性骨髓瘤(Multiple Myeloma)CNV:拷贝数改变(copy number variation)MMRC:多发性骨髓瘤研究组织(the Multiple Myeloma Research Consortium)M3CN:多发性骨髓瘤分子关系网络(multiple myeloma molecular causal network)RIMBANet:重构整合的分子贝叶斯网络(Reconstructing Integrative Molecular Bayesian Network
一.研究背景
多发性骨髓瘤(MM)是一种恶性浆细胞病,是第二常见的血液癌。MM是高度复杂和高异质性的疾病,整合多组学数据去研究MM的发生、发展以及识别药物反应机制对于MM的治疗十分重要。
小编 今天推荐的这篇文章 Liu等人通过整合MMRC(the Multiple Myeloma Research Consortium)中的基因表达谱数据、拷贝数变异数据以及相应的临床数据最终构建了多发性骨髓瘤分子关系网络(M3CN)。
标题:A Network Analysis of Multiple Myeloma Related Gene Signatures 杂志:Cancers IF:6.612 发表时间:2019.9.27
本课题具体思想如下(如Fig 1):
1. 他们通过严格的质控校正样本的标签错误,得到较为准确的同时有着基因表达和拷贝数变异数据的配对样本;
2. 为了识别分子特征之间的潜在关联和因果关系,Liu等人使用贝叶斯网络算法去整合基因表达和拷贝数数据构建M3CN网络;
3. 通过文献检索得到MM相关的预后以及药物反应相关的基因标志物集合,将标志物基因映射到M3CN中去,进而得到更为鲁棒的MM预后相关子网;
4. 在数据集中比较M3CN预后子网和已发表的预后signature之间的性能,进而评估预后子网的性能。Liu等人的结果表明,网络方法分析可以更好揭示MM相关的生物学机制。
Fig 1. 流程图二.主要方法和材料
(1)训练数据:来自MMRC中的基因表达谱数据(n= 304,GSE26760)、拷贝数改变数据(n= 254,GSE26849)以及样本相应的临床数据。使用proMODMatcher较正样本标签。
(2)染色体标记基因:XIST是x染色体的标记基因;RPS4Y1是Y染色体的标记基因。
(3)CNV cis调控基因表达:CNV通常发生在染色体较大的区块中,位于这些相同的区块中的基因可能共享相同CNV。由相同的CNV所调控的基因倾向于共表达,通过皮尔逊相关系数寻找这些关系对(fdr<0.01)。
(4)M3CN网络的构建:结合配对的基因以及拷贝数改变数据,采用重构整合的分子贝叶斯网络(RIMBANet)算法构建MM相关的网络,具体构建过程如Fig 2所示。为了提高运算速度,首先,对于每一个基因对,计算其互信息,剔除互信息排在后20%的关系对,从而得到每个基因候选的关系对;然后,通过马尔科夫模型重构网络,该算法给不同的种子,最后得到的网络结构会有所差异,因此,随机1000次,从而得到1000个候选网络结构,最后保留那些后验概率大于0.3的一致网络结构,再删除网络中的循环结构,最后,得到了M3CN网络。
Fig 2. 网络构建A)不考虑拷贝数改变的网络构建;B)结合拷贝数改变的网络构建(5)MM预后相关标志物:通过文献挖掘收集(时间截止到2019年8月)得到MM相关的预后标志物,从中筛选出基因数大于15的预后标志物(如Table 1所示)。
(6)MM药物相关的标志物:通过文献挖掘收集得到MM药物相关的标志物,这些标志物的包含的基因数范围从42到244个(如Table 3),其中,只有648个病人有生存数据,后续只对这648个病人进行分析。
(7)关键调控因子的识别:将Hose_50、Huiper_92和Shaugnessy_70的预后标志物包含基因作为种子,通过上述网络构建算法,在M3CN去寻找步长为2的子网,如果输入的基因在这个子网中,保留这个子网,基因i作为候选的关键基因。
(8)通路分析:通过PANTHER网页版(版本:14.1,http://www.pantherdb.org/)对基因进行功能分析,卡FDR<0.01。
(9)验证数据集:从MMRF(https://research.themmrf.org)得到CoMMpass数据集(n = 767),其中,只有648个病人有生存数据,后续只对这648个病人进行分析。
(10)网络可视化:通过Cytoscape 3.7所示)映射到RIMBANet构建的M3CN网络中去,最终得到一个预后相关的子网。
三结果展示
1. 预后相关的子网:
将文献挖掘得到的8个满足基因数大于15的MM预后相关标志物(如Table 1所示)映射到RIMBANet构建的M3CN网络中去,最终得到一个预后相关的子网。
Fig 3预后相关的子网黄色的点表示Kuiper_92,绿色的点表示Shaughnessy_70,红色的点表示Hose_40 genes以及蓝色的点表示其他的预后标志基因。
2. 预后子网基因识别亚型:
结合上述预后子网中的基因,分别采用层次聚类和k均值聚类(k)对CoMMpass数据集中的样本进行聚类,对k均值聚类划分的三类样本,通过log rank检验看各类之间OS和RFS生存曲线是否差异(如Fig 4所示)。
Fig 4. 预后子网划分亚型A) 层次聚类;
B) k均值聚类。红色代表高风险样本组,
绿色代表中度风险样本组,蓝色代表低风险样本组;
C-D) 高中低风险组的log-rank检验图。
3. 预后模型对CoMMpass数据集的评估:
将预后网络子网中的基因构建的预后模型与Table 3中的已发表的MM预后模型进行比较,发现预后网络子网基因所构成的预后模型在OS和RFS中的预测性能更好(如Table 2所示)。
4. 耐药相关网络的构建:
蛋白酶体抑制剂(PIs)和免疫调节剂(IMIDs)的应用,多发性骨髓瘤(MM)预后明显改善,结合Table 2中的耐药相关基因标志物,将Zhu_244 和 Bhutani_176这两个耐药相关的基因作为种子,映射到网络中,识别耐药相关的子网(如Fig 5所示)。
Fig 5. 耐药相关网络
红色基因来自Zhu_244,绿色来自Bhutani_176,
红色的边表示直接和输入的基因连接。
四 结论
(1)构建了一个分子因果网络来描述MM中潜在的调控关系网络M3CN;
(2)基于文献挖掘的MM预后相关标志物,最终映射到M3CN中去识别一个更为鲁棒的MM预后相关子网;
(3)MM发病机制复杂,结合网络去分析能更好的解释MM潜在分子机制。
五 相关文献
Zhu, J.; Zhang, B.; Smith, E.N.; Drees, B.; Brem, R.B.; Kruglyak, L.; Bumgarner, R.E.; Schadt, E.E. Integrating large-scale functional genomic data to dissect the complexity of yeast regulatory networks. Nat. Genet. 2008,40, 854–861.
往期分享
02-IF7+:纯生信泛癌分析挖掘可用于ICI应答预测的生物标志物
网友评论