| 之前跟大家分享过“差异基因不显著的应对方法“;但同时,也有很多朋友表示他的项目差异基因不仅显著,并且还很多多多!这个问题应该很多朋友会遇到,所以今天我们来探讨一下“差异基因很多时该怎么办”的问题。
首先我们来明确一下, 差异基因很多的原因有2个方面,首先:
①生物调控是一个系统,是一个由点→面的级联放大过程,同时包括了正反馈与负反馈。
②然后一个基因包含了多种功能
不过重要的是,针对我们的研究目的而言,并非所有的差异都有意义。
所以差异基因很多怎么办呢?我们通过2个案例分析一下。
初级方法:首先找到正确的方向and排除非主要因素。
比如我们曾经处理过一个项目,用温度处理某种生物胚胎,然后RNA-seq结果,观测到了大量与新陈代谢相关的基因表达量变化。那么,问题来了,新陈代谢与研究目标没有关联,怎么做后续分析?这个时候应该果断放弃新陈代谢方向,然后往什么方向研究呢?当然是往你期望的方向靠拢啊啊啊。
比如这篇研究作者想分析组蛋白通路。我们都知道胚胎时期是决定表观遗传的关键时期。所以我们应该重点关注DNA甲基化酶和组蛋白修饰酶的差异变化。
进阶方法:差异基因趋势分析+通路逻辑
背景:荔枝书属热带、亚热带广泛种植的常绿木本树。在全球变暖、气候变化时导致的开花缺陷对于荔枝生产是主要挑战。以前的研究已经表明,高温条件可促进花蕾中早期叶的生长并且抑制荔枝开花,而甲基紫精二氯化物(MV)诱导的活性氧可以促进早期叶的衰老、脱落。为了解活性氧在荔枝开花过程中的分子功能,对荔枝进行了转录组测序并从头进行组装。
<ignore_js_op style="overflow-wrap: break-word;"> image</ignore_js_op>
无独有偶,这项研究的差异基因也非常多,5000+个。于是我们将所有差异基因进行趋势分析(减少短时间基因随机波动的影响),逐步找到目标基因;然后将差异基因进行KEGG注释,找到具有代表性的10个通路。其实这个时候也可以发一篇SCI了,但是要让文章水准上一个台阶,就需要扯通路之间的逻辑关系了。比如某个信号转导通路表达量显著整体提高了,可能是因为上游某个信号传导的敏感性,这篇文章正是如此。
总结一下:差异基因很多可能是大家经常遇到的问题,但是将数据回归生物学问题本身是最基本也是最有效的方法。有时候我们需要果断弃掉一些非主要因素,然后再考虑内在的逻辑关系。
|
网友评论