转录组分析是目前应用最广的高通量测序分析技术之一。常见设计是不同样品之间比较,寻找差异基因、标志基因、协同变化基因、差异剪接和新转录本,并进行结果可视化、功能注释和网络分析等。
转录组的测序分析也相对成熟,从RNA提取、构建文库、上机测序再到结果解析既可以自己完成,又可以在专业公司进行。概括来看转录组的分析流程比较简单,序列比对
-转录本拼接 (可选)
-表达定量
-差异基因
-功能富集
-定制分析
。整个环节清晰流畅,可以作为最开始接触高通量测序学习最合适的技术之一。
但重点和难点在于理解这些过程都是怎么做的,有什么需要注意的,结果怎么解读,后续分析怎么做。这些只有自己动手操作过,才可能有理解。而理解了一个,再去做其它类型分析,也会轻松很多。
实验设计这块重要的是对照和至少3
个生物学重复,并选择合适的测序通量。ENCODE
要求重复之间的Spearman correlation
值大于0.9
(遗传背景不一致的生物重复相关系数要大于0.8
)。定量基因表达和评估转录图谱相似性只需要中等测序深度;而研究新转录本和可变剪接则需要更深的测序;一般来讲长RNA-seq文库测序深度满足可用reads
在20-30 million
(如果测PE150,换算成碱基数为6G-9G)。
另外一个需要注意的是测序的批次效应,保证自己的样品同时处理、RNA同时提取、同时构建文库和上机测序。这些环节虽然不能总受我们控制,但记录下对应的操作时间和批次,最后在绘制表达图谱时与实验相关参数进行关联展示
,从而保证结果没有受到试验中处理批次的影响。ENCODE
计划有一篇文章在比较人和小鼠不同组织的表达谱相似度时得到的结果是样品按物种而非组织聚在一起,这与之前认为的发育通路的保守性不符。后来发现是测序批次捣的鬼,做了批次效应矫正后,表达图谱按组织而非物种聚在一起了。
再强调下,培训时间是2017年11月4日、5日、11日、12日。培训地点是北京,<mark>点击阅读原文可查看详细信息</mark>。
欢迎大家咨询、报名和提出建议 (报名网址: http://www.ehbio.com/Training)。
网友评论