美文网首页
疾病纯生信分析套路 基于表达谱研究疾病七大思路汇总

疾病纯生信分析套路 基于表达谱研究疾病七大思路汇总

作者: 概普生信 | 来源:发表于2020-09-24 09:18 被阅读0次

    昨天我们推广的疾病的分析思路,火爆网络,索性今天再来一个返场小段,供大家消遣一下。

    因为大部分的疾病不致死,或者说预后部分的信息收集并不全面,所以在做生信分析的时候跟肿瘤相比,就缺了最重要的一步预后效果验证如何。

    我们之前说过肿瘤筛选marker有三大步骤,差异,降维,预后。

    但是对于疾病来说没有了预后,文章思路就不完整了。

    小编今天通过对AD研究的几篇文章来简单介绍下如果没有预后,我们如何研究,如何分析。

    1、核心基因+多因子(6+)

    2、WGCNA+多样本验证(3+)

    3、WGCNA+多因子(1.9)

    4、Network&pathway(2.4)

    5、CeRNA思路:多套数据整合(3.6)

    6、基因诊断模型+WB验证(2.8)

    7、lncRNA诊断模型+SVM(8.9)

    一、核心基因+多因子

    Identification of molecular signatures and pathways to identify novel therapeutic targets in Alzheimer's disease: Insights from a systems biomedicine perspective

    (Genomics IF: 6+)

    核心基因是公号去年推广的一个免费视频,简单说来就是GEO数据筛选差异,通过网络降维,然后TCGA预后验证。但是如果对于疾病没有了预后,通常我们会增加TF、miRNA、Drug等因子的研究,筛序到核心的基因,再拓展下相关的因子、药物等等。

    二、WGCNA+多样本表达验证

    Identification of KIAA0513 and Other Hub Genes Associated With Alzheimer Disease Using Weighted Gene Coexpression Network Analysis

    (Froniter in genetics IF: 3+)

    这篇文章研究的是颞叶皮层AD样本的WGCNA分析,筛选到核心模块和基因之后,还是缺点东西,所以作者选择了去用其他的组织样本进行表达验证,甚至用了老鼠的样本。

    同时,作者深知分析内容不够,生信来凑的实际情况,于是这篇文章的图,超级精美。

    看到这有小伙伴就说了,难道不能WGCNA筛选降维之后,看看多因子么,当然可以。

    三、WGCNA+多因子

    Screening and Identification of Potential Peripheral Blood Biomarkers for Alzheimer’s Disease Based on Bioinformatics Analysis

    (medical science monitor IF: 1.9+)

    还记得小编说过的吧,要保证思路、分析、数据至少有一个不一样。

    这篇文章也是WGCNA,虽然后面成了多因子,但是呢如果样本也都一样,还是有作弊的嫌疑。

    但是呢,作者很厉害,选择的是PBMC的数据。

    分析内容为筛选差异,WGCNA筛选核心基因和模块,富集分析,然后针对核心基因找多因子分析。

    同样,图很漂亮。

    说到疾病,不能忘记下面这个疾病研究的经典思路。

    四、Network&pathway

    Integrated identification of key genes and pathways in Alzheimer’s disease via comprehensive bioinformatical analyses

    (hereditas IF: 2.4)

    这个是什么意思呢,就是筛选差异,做完降维之后,更多的放在富集分析上,多做些富集分析的内容,不往后走了。

    五、CeRNA思路:多套数据整合

    Systematic Characterization of Circular RNA-Associated CeRNA Network Identified Novel circRNABiomarkers in Alzheimer’s Disease

    (Frontiers in Bioengineering and Biotechnology IF: 3.6)

    这个不多说,跟多因子的思路差不多,不过由于ceRNA研究涉及到lcnRNA就得验证,所以人家作者挑战了高难度选择了circRNA,这样不验证的理由可以是数据少喽,轻松过关。

    换句话说,做这个思路不管是数据多少,其实就是辛苦活了,堆了很多的数据。

    The data analyzed in this study were obtained from the GSE5281, GSE1297, GSE12685 GSE16759。

    六、基因诊断模型+WB验证

    Identification of Blood Biomarkers for Alzheimer’s Disease Through Computational Prediction and Experimental Validation

    (Frontiers in Neurology IF: 2.8)

    寻找marker ,降维,有分析意向(http://gaptechsxr.mikecrm.com/1vdMmqy)生信人WX公众号构建模型来做诊断模型,这个很经典,但是很难找到合适的数据验证的时候,就得需要通过实验来验证了,这个思路也很不错。

    有小伙伴问了,如果诊断数据不够,我又想做诊断模型,应该怎么做。

    我建议你提高难度系数,做lncRNA的诊断模型,同时构建诊断模型的时候选择一些高级的模型构建方法,比如这一篇。

    七、lncRNA诊断模型+SVM

    Analysis of long noncoding RNAs highlights region-specific altered expression patterns and diagnostic roles in Alzheimer’s disease

    ( briefings in bioinformatics IF:8.9)

    通过整合芯片的原始数据,构建lncRNA的表达谱数据,然后筛选差异的lncRNA,构建基于lncRNA的诊断模型。差异的lncRNA+SVM,效果确实好啊。

    相关文章

      网友评论

          本文标题:疾病纯生信分析套路 基于表达谱研究疾病七大思路汇总

          本文链接:https://www.haomeiwen.com/subject/vlroyktx.html