转录因子-和ncRNA介导的阿尔茨海默病潜在致病基因模块分析
Hello,大家好,最近都在忙什么呢?是不是每一天都充满希望,享受阳光呢?今天小编想和大家分享的是一篇关于转录因子和ncRNA介导的阿尔茨海默病潜在致病基因模块分析的文章。这篇文章是今年8月份发表在Aging-US上的,影响因子5.179,全文思路清晰,易于模仿。
文章流程如下,是不是足够清晰明了呢?
阿尔茨海默病(AD)是一种起病隐匿的进行性发展的神经系统退行性疾病。临床上以记忆障碍、失语、失认、视空间技能损害、执行功能障碍以及人格和行为改变等全面性痴呆表现为特征,病因迄今未明,在发达国家是第四大常见死因。在本研究中,作者首先识别出AD和健康个体之间差异表达的基因,并将其用于构建蛋白-蛋白相互作用(PPI)网络。利用AD相关的PPI网络对功能模块进行识别,富集分析结果表明这些功能模块与阿尔茨海默病、凋亡及相关通路均有显著的相关关系。另外,文章也预测了可能调控功能模块的ncRNA和转录因子。hub基因和转录因子的表达在另一套独立的数据集中也得到了验证,为进一步研究AD发病机制提供启发和参考。
1. 数据来源于GEO数据集GSE110226,临床信息如下。
2. 对AD样本进行基因集合富集分析(GSEA)。
对AD样本进行基因集合富集分析(GSEA)。GO通路分析表明AD样品在蛋白调控相关的生物学过程中显著富集,如蛋白成熟负调控和蛋白自磷酸化。KEGG通路分析则表明在AD样品中神经营养通路显著富集,如磷脂酰肌醇和神经营养因子信号通路(下图A,B)。
3.识别AD样本和正常样本间差异表达基因并对其进行富集分析。
最终作者共识别到4239个差异表达基因(DEGs),其中在AD样本中表达上调的有2542个,下调的有1697个(图C)。对上调最多的100个DEGs和下调最多的100个DEGs进行聚类分析。分析结果表明,这200个DEGs的表达谱能够准确区分AD与对照样本(图D)。
4.构造蛋白质互作网络(PPI)并对其进行模块分析。
通过STRING v10数据库的蛋白质互作关系,构造出一个包括3861个DEGs节点和268363 条边的的蛋白质互作网络。接着计算网络中每个节点的权重值(W)( | logFC |* - log10 (P值)*度)。W值越大,则说明该节点PPI网络中越关键。其中,W值最高的基因节点为SLC11A1、SERPINE1、EFCAB3、PIM1、IL6、BCL6、RND3、ZBTB16、LRG1、RASL10B。我们将其定义为hub基因。基于ClusterONE plug-incohesion-guided 算法,我们挖掘出共包含1730个相关基因的20个功能模块(图3A,图3B)。
为了探讨功能模块在AD发病机制中的作用,我们对每个模块进行GO功能和KEGG通路富集分析。GO富集分析主要富集到了2114个生物学过程,296个细胞组分和393个分子功能, KEGG通路富集分析则确定了1203条通路。我们发现六个模块可以显著富集到线粒体内膜和线粒体基质通路。图C显示了至少在四个以上模块显著富集的GO terms,图D则显示了包含至少出现在八个以上模块的KEGG通路。这20个功能模块中的任何一个或几个都有可能共同作用,形成导致AD的功能通路。
5.识别功能模块相关的ncRNAs 和TFs。
基于超几何检验预测显著调控功能模块的ncRNA,共识别到由706个ncRNA参与的1198对ncRNA和功能模块的调控关系。其中,microRNA- 32-5p可调节8个功能模块,MALAT1可调节7个功能模块,let-7d-5p、TUG1、microRNA-136-5p、microRNA- 181c-5p可调节6个功能模块(图4A)。
基于超几何检验预测显著调控功能模块的TFs,共识别到由70个TFs 组成的77对TFs和功能模块调控关系。这些TFs在AD中有不同程度的表达(图4B)。其中,PPARA可以调节三个功能模块, ABL1、SP1、STAT6和TBP可以调节两个功能模块。
结果表明,这6个ncRNA和5个TFs可能与AD发病机制密切相关。为了降低噪声和假阳性,我们对5个TFs与其靶基因的表达进行相关分析,选择显著相关的靶向关系构建网络(图4C)。最后,文章将该网络与KEGG富集分析相结合,构建了一个AD相关的ncRNA/TF-target genes-pathways综合调控网络(图4D)。
6.差异表达验证和ROC分析
最后,选择在蛋白质网络中权重最高的10个基因的和上面提到的五个TFs在 GSE33000数据集中进行验证。GSE33000共包含310例AD和157例健康脑组织的表达数据。10个权重最高的基因中,有八个 (BCL6, EFCAB3, IL6, LRG1, PIM1, SERPINE1, SLC11A1, ZBTB16) 在AD样本中表达明显上调(p < 0.05),有两个TFs (PPARA和STAT6)在AD样本中表达明显上调(p < 0.05),与GSE110226数据集中分析结果一致(图5)。ROC曲线分析表明,这些分子可能是AD诊断的潜在生物标志物(图5B)。其中,BCL6的分类效能最优,在GSE110226数据中,ROC曲线下面积高达0.976,在 GSE33000数据集中ROC曲线下面积为0.905。
今天的大概内容就是这些了,让我们简单总结下吧。首先基于GSE110226中AD样本及正常对照脑组织基因表达谱数据,识别出AD与正常样本的差异表达基因,并基于这些差异表达基因构建了一个PPI网络,识别出20个与AD相关的功能模块。对功能模块进行富集分析,结果表明这些功能模块与阿尔茨海默病、凋亡及相关通路均显著相关。另外,本研究预测了可能参与AD发病调控功能模块的ncRNA和转录因子。这些hub基因和转录因子的表达在一个独立的数据集中GSE33000也得到了进一步验证。
不知道大家都学会没有啊,如果get到了就休息一下,一起享受享受这美好的阳光吧!
网友评论