盼星星,盼月亮,期望有个人带我进入转录组的世界,在此由衷的感谢花花和小泽(生信星球创始情侣)带我开始遨游
只有7天的学习时间,告诫自己请珍惜!!!!
1.啥是转录组?
中心法则中心法则:DNA转录成RNA,RNA翻译成蛋白,DNA是基因组主要研究对象,而RNA就是转录组研究对象
-基因组Genome:它是一个细胞或者一个生物的完整序列,包括基因与基因间区。
-RNA种类:可编码蛋白的为mRNA;其他的是非编码RNA(non-coding RNA, ncRNA)【包括rRNA (核糖体RNA,ribosomal RNA)、tRNA (转运RNA,transfer RNA)、snRNA (小核RNA,small nuclear RNA)、snoRNA (核仁小RNA,small nucleolar RNA)、microRNA (小非编码RNA,miRNA)和lncRNA (长非编码RNA,long non coding RNA)等。
如果我们关心的是mRNA,而测序时选择了全部的RNA进行测序,那么测序结果中包含的大部分结果都将是rRNA和tRNA。因此这个就需要利用实验手段将mRNA进行分离(Ploy A),或者去除比例最大的rRNA、tRNA。
综上,转录组(Transcriptome)广义上表示mRNA、rRNA、tRNA、非编码RNA,狭义上表示所有的mRNA。它要研究的问题就是:同一基因不同器官/组织中,它们包含的DNA可能是一样的,但是转录出来的RNA却差异很大,寻找差异基因;另外同一基因在不同条件下的表达不同,比如有的基因在盐碱条件下会表达增高,以促进植物适应盐碱环境的生存。
2.转录组干啥了?
推荐文章一篇:https://www.nature.com/articles/nmeth.2735
转录组重建工作,就好像是把被碎纸机粉碎的杂志又一本本地重新拼接起来。
有很多杂志(即RNA)每一期都“印刷”了很多本,其中有一些可能还有存货,还有一些留在报刊亭里,可是有一些却早就被“卖光”了。在过去,经销商们只会关注销量最好的杂志,而这种杂志每一本都非常贵,所以你可能也就买得起几本而已(喻指RNA研究技术和相关产品非常少,而且价格昂贵,科研人员只能对比较重要、热门的几种RNA进行研究)。可是现在,由于测序技术,以及相关技术的飞速发展,你可以把报刊亭里的所有杂志全都买回去,而且价格还不贵。唯一的区别就是经销商卖给你的并不是一本本的杂志,而是先把所有的杂志全都放进碎纸机里,然后把一大堆碎纸条卖给你。幸运的是,在这个虚拟的世界里,还有那么一大帮热心的社会改良家来帮忙整理碎纸条(tape-wielding dogooders,这帮人就是我们现实生活中的计算机程序开发人员),帮助我们将碎纸条还原成一本本的杂志。还有一群像RGASP这样的统计狂热分子也跑来凑热闹,他们组织了一场比赛,看看哪些人整理碎纸条的效率最高,准确率最高,能够又快又好地还原出杂志的本来面目。这个整理、拼接碎纸条的工作就是“转录子重建(transcript reconstruction)”工作,这也是Steijger等人的文章里最关注的工作。而转录子重建工作的重点内容之一就是将RNA测序得到的片段信息与该RNA来源细胞的基因组对应起来,这就是Engström等人的文章里最关注的工作。
3.关于测序
目前二代测序主要采用Illumina平台
参考:https://www.illumina.com/systems/sequencing-platforms.html
4.转录组分析有什么流程?
没有唯一的流程,找到适合自己样本的分析流程!!
分析流程
参考文献:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-016-0881-8 A survey of best practices for RNA-seq data analysi
有参分析流程基于参考基因组比对:因为基因组包含了基因间区、内含子区域,因此比对时选取的比对软件就要具有"跨越式拼接”特性,比如STAR、Hisat2;
基于参考转录组比对:Bowtie、BWA;
无参考基因情况:需要拼接Trinity:利用测序reads从头组装拼接出参考unigene,再将每个样本的reads比对到参考unigene上,计算表达量;
对于大部分没有参考基因组或者基因组注释不好的物种,无参方法是比较理想的解决途径,但是比有参要消耗更多的内存、运行时间。
参考:http://www.mi.fu-berlin.de/wiki/pub/ABI/GenomicsLecture12Materials/rnaseq1.pdf
接下来刷文献去~
每日一导
DAY1
网友评论