GFOLD:广义倍数变化
image.png
有重复的转录组数据,用的比较多的是DEseq2(负二项分布),edgeR(负二项分布), edgeR(二项分布)。
没有重复转录组数据,普遍推荐使用统计大学的GFOLD。
mRNA-seq的一大应用就是基因表达定量和筛选差异表达基因,使用常用工具edgeR、DESeq、baySeq、Cufflinks分析,最好有生物学重复,而最新的hisat2 + stringtie + ballgown套装则要求必须有重复。这里给大家介绍一个对重复无要求、简单好用、效果也好的软件:GFOLD。
- 差异表达基因数量:GFOLD与benchmark有更多的交集。
- 敏感性:GFOLD略高一筹。
Acurve that is closer to the top left corner of the plot is considered toachieve better specificity。
- 使用方法:
第一:用Bowtie将read map到基因组上,产生sam结果文件(如sample1.sam,sample2.sam),命令略;
第二:将sam文件转化为GFOLD输入文件,命令:gfold count -ann hg19_Ref.gtf -tag sample1.sam -o sample1.read_cnt;
第三:计算,命令:gfold diff -s1 sample_1 -s2 sample_2 -suf .read_cnt -sc 0.01 -o sample_1-VS-sample_2.diff;
第四:筛选,GFOLD values等于0,表示该基因不差异;大于0,表示该基因上调;小于0,表示该基因下调。
原文: Feng J, Meyer C A, Wang Q, et al. GFOLD: a generalized fold change for ranking differentially expressed genes from RNA-seq data[J]. Bioinformatics, 2012, 28(21):2782.
网友评论