近几年,RNAseq测序价格极大降低,许多老师大量的做RNAseq。RNAseq是对样品中的totalRNA提取并进行高通量测序,通过分析获得各类分子的表达量。通过对照组与处理组等比较得到差异表达的基因,并对差异基因进行如GO/KEGG富集,了解处理因素影响的生物学过程、通路等。
RNAseq是RNA分子测序的总称,常见的有mRNA测序,miRNA测序,lncRNA测序,circRNA测序,也可以全部测序,称为全转录组测序。
这几类测序都需要先获得样品的totalRNA, 根据所需要分子的不同。可以对各类分子分别提取,比如用polyA法提取mRNA,进行测序,获得编码蛋白的基因表达谱;通过电泳获得10-50bp左右的small RNA,并进行测序,获得miRNA表达谱。通过去除rRNA,富集长链的RNA的方法获得lncRNA, mRNA表达谱;通过去除线性RNA的方法获得circRNA的表达谱。
通过RNAseq可以筛选出差异表达的分子,进而选取分子进行验证,构建调控机制。但可能整个实验的周期很长,比如1-2年时间,甚至更长。通过接触很多的客户,发现许多老师,在我们这里做了RNAseq实验,希望先对RNAseq的数据进行分析,整理,希望纯数据分析或者稍加验证就可以发表文章,虽然这类文章看过很多,但没有总结明确的规律,秉承解决客户一起问题的原则,我们接下来,对几十篇这类文章进行分析。以了解RNAseq纯分析类文章该如何构思,如何描述数据,放哪些图等。
我们引用“中药研究RNA-seq分析文献2”这篇文章来看一下。
牛蒡子苷元是一种抗癌药物,探讨EriB对血管生成的影响,以斑马鱼为动物模型,观察斑马鱼胚胎中肠下静脉的形成。分别用3种剂量的药物(5,10和15μM)处理斑马鱼胚胎72小时时,SIV的形成受到抑制。那么问题来了,抑制的机理时什么,胚胎内哪些基因发生了改变,哪些生物学功能,通路发生了改变?然后作者,将对照,10um药物组,15um药物组样品拿去做RNAseq。并进行生物信息学分析,获得差异基因及其涉及的生物学过程、通路等。
RNAseq结果展示1(附件):对照组、药物浓度1组、药物浓度2组差异基因展示及GO/KEGG结果。
说明:A是所有的差异表达基因,1500个,可以看出,作者没有做生物学重复,由于基因过多,所以未显示基因名字。这是一个差异表达基因的常用展示方法,将所有差异基因做个热图。B,对差异基因做KEGG,找通路。C,GO分析中的生物学过程。D:细胞组分,E:分子功能,F:主要的蛋白结构域。这里展示的是-log10(p-value)。有些老师觉得是不是必须用padj,我觉得没必要。
RNAseq结果展示2(正文):使用p<0.05筛选差异基因,发现有72个差异表达,1 up-regulated and 51 down-regulated(p < 0.05)。
结果说明:A图是选出来的72个基因的热图。一般来说,我门在正文里放热图 时,多选择一部分与实验相关的基因,比如本文的抗血管生成的基因。我经常跟老师讲,RNAseq的热图一般是不能直接用的,公司给出的是所有差异基因的热图,或者top100这样的热图。而文中的热图要根据实验需要挑选基因放热图。所以写文章时需要找公司重新绘制热图。所以公司的服务质量非常重要。如果不知选哪个公司做RNAseq,找我们就好了。B图是挑选的部分大于2倍的基因做的qPCR。说明与RNAseq的结果一致。
RNAseq结果展示3(附件):差异基因列表
作者将差异基因列表作为附件,如下:
RNAseq结果展示4(附件):差异基因富集的GO/Pathway
接下来,作者对做了细胞的周期、增殖等检测,说明牛蒡子苷元对细胞的影响,同时找了靶标通路。
这篇文章,我们可以看出,RNAseq是对细胞、对所有基因的整体描述,通过全基因表达谱,我们可以看出细胞基因发生了哪些变化,通路发生了哪些变化等。
该文RNAseq展示的结果,是所有差异基因热图,差异基因列表,差异基因GO/KEGG富集图,富集通路表,重要基因热图。
网友评论