做科研的都知道开创性的工作自然意义重大,但那是可遇不可求。迅速跟进大牛们开创性的思路或者方法,结合自身的研究基础,做出类似的成果无疑是个高效的策略。
早些年的转录组可谓是典型的代表,不少人靠着雷同的实验材料和设计刷了大量的SCI。近期不少公众号都在力荐“基因家族”分析,认为这是一个低成本、低要求、产出快的思路。今天我们就来解读一篇相关文章,看看是否真的具有可复制性?实现难度怎么样?
文章选择
我们从多篇候选中选择了一篇2018年发表在《BMC Genomics》上的菠萝WRKY基因家族分析文章进行解读。原因有两点:
1. WRKY是一个经常被研究的基因家族,其在植物抗逆调控网络里扮演重要角色,和多种生物、非生物下的胁迫适应相关;
2. 菠萝的基因组公布距今不足3年,很多基因家族未被精细研究过。基因组公布不久的物种中,很多基因家族仍等待着被发掘,无疑是应用这类思路的理想选择。
文章主要分析内容:
我们查看了多篇3-5分基因家族文章,其主体分析条目完全担得起“基本类似”的评价,这就满足了套路文章的首要条件了。下面我们就将其分析条目总结出来,看看实现难度如何。
1、基因家族的鉴定
作者根据Pfam数据库当中WRKY基因家族的保守结构域(编号:PF03106 )信息,利用HMMER 3.0软件在菠萝基因组当中对所有基因序列进行搜索,如果存在该保守结构域即判定为WRKY家族候选基因,再用PFAM and SMART两个软件进一步确认。该文作者最终在菠萝基因组当中鉴定了54个基因为菠萝WRKY基因家族成员。
需要注意的是,部分基因家族在Pfam数据库里没有被收录,对于这类基因家族,我们只能在模式植物,如拟南芥,中搜集已知的基因家族成员序列,然后在自己研究的物种中进行序列比对,从而对基因家族成员进行鉴定。
2、染色体位置分布和加倍复制分析
绘制WRKY基因家族在菠萝染色体上的分布情况。并利用MCScanX软件做共线性分析,发现菠萝基因组当中WRKY基因家族存在复制现象。如下图中灰色的线代表菠萝基因组当中所有的共线性关系,红色的线代表了WRKY基因家族成对的复制现象。
3、系统进化树分析
使用MEGA软件对54个菠萝WRKY基因的蛋白质序列进行多序列比对,构建系统进化树,为了方便对基因进行分类,还把拟南芥当中的部分WRKY基因也加进去一起进行分析。通过进化树分析,以及结构分析,可以把这54个基因分成3大类8个亚类。
4、基因结构分析
利用MEME绘制基因的外显子和内含子位置信息,以及基因序列上的motif信息,并将这些基因结构信息按照系统进化树的顺序进行展示。从中可以观察出不同分类的基因在基因结构层面的异同点。
5、和基因表达量数据的结合
基因家族的主体分析内容完成之后,还可以结合转录组或者qPCR等基因表达数据进行进一步挖掘。
该文作者就把之前已经发文的转录组数据拿来又重复利用了下。以下为WRKY基因家族在菠萝不同组织当中的表达情况。
由于WRKY基因家族与抗性相关,所以作者还利用不同胁迫处理后的转录组数据来验证WRKY基因家族基因对胁迫的响应表达,发现很多基因对处理都有很强的响应表达。
该部分基因表达模式分析,大多数文章中都是利用已测基因表达数据,或者直接下载公共数据库里的转录组数据等,实在没有合适的数据才需要自己做些转录组或者qPCR。
基因家族可以称为套路
这篇文章可以说是基因家族分析文章的典型,该类文章之间的分析内容确实比较类似,大部分情况下就是换了个物种或者基因家族,发的分数也集中在3-5分,可借鉴性很强。
另一方面,从分析难度上看,有一定生信基础的同学掌握这一系列分析内容是很简单的。这么看来“基因家族”分析确实可以称得上是一个优秀的SCI论文素材。
基因家族分析,费用如何?
经过我们的调研,实现该类型分析有两种方式,但价格差异却很大:
第一种方式,全套交给公司去做,报价在2-3万不等,由于不属于标准化产品,考虑到公司的人工及研发成本,价格还算合理。
第二种方式,经过专业的训练,学习之后自己进行分析工作。已经有部分学术团队制作了相关的视频教程,价格在千元以内,能省很多经费,而且自己也多一技在身。
在此给大家推荐一个优秀的相关视频:组学大讲堂制作的《基因家族分析》视频教程,涵盖了该类型文章中绝大部分的分析内容,并尽量照顾0生信基础同学,降低了上手难度,一般经过半个月的学习和练习之后就可以掌握基因家族的分析技能,同时设置了专门的技术交流QQ群在线解答分析中出现的问题。
想按上面的思路来篇文章的同学赶紧点击下面链接吧:
https://study.163.com/course/introduction/1209048893.htm?share=1&shareId=1031484705
参考文獻:
Xie T, Chen C, Li C, et al. Genome-wide investigation of WRKY gene family in pineapple: evolution and expression profiles during development and stress[J]. BMC Genomics, 2018, 19(1):490.
更多生物信息课程:
1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程、基因家族文献思路解读
2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读
3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析
4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘、转录组文献解读
5. 微生物16S/ITS/18S分析原理及结果解读、OTU网络图绘制、cytoscape与网络图绘制课程
6. 生物信息入门到精通必修基础课,学习链接:linux系统使用、perl入门到精通、perl语言高级、R语言画图
7. 医学相关数据挖掘课程,不用做实验也能发文章,学习链接:TCGA-差异基因分析、GEO芯片数据挖掘、GSEA富集分析课程、TCGA临床数据生存分析、TCGA-转录因子分析、TCGA-ceRNA调控网络分析
8.其他课程链接:二代测序转录组数据自主分析、NCBI数据上传、二代测序数据解读。
网友评论