之前一直用的是Tophat + Htseq-count + Deseq2的分析组合来做rnaseq的回帖,确定基因表达量,以及做差异基因的分析。
但是,tophat已经是比较过时的软件了,最重要过时原因是做一个回帖需要的时间太长了,而STAR所用的时间只是它的三十分之一左右。并且,输出的bam是unsorted的,需要自己再做一步bam file sorting。
而htseq-count只能得到gene read counts,而不能得到TPM或者RPKM的值来显示每个基因的归一化之后的表达量。而用RSEM软件则很好的解决了这个问题。
因此,一个好的RNASeq分析流程就可以是:
1. 用Star做reads mapping
2. 用RSEM做基因表达量的quantification
3. 用DESeq2做基因差异分析
这一步的输入文件就可以从STAR中来,因为STAR内置了htseq-count的函数,可以输出gene read counts。另外,DESeq2的performance在做差异基因的软件里面表现得是最好的。
网友评论