使用Cufflinks里面的工具gffread
执行命令: gffread **.gff -T -o **.gtf
gffread merged.gtf -o- > merged.gff3
cufflinks详细用法参考:陈连福的生信博客
问题挺好:
junction:剪接接头
博主师兄您好, 我刚开始学习RNA-seq数据分析,楼主的文章给我收获很多,谢谢。 有几个问题想请教。
我根据12年Nature Protocol 的文章,用Tophat和cufflinks处理数据。
1. 我的数据是细菌,基因组是刚测序完的草图。自己根据网上的格式介绍尝试做了一个.gtf 的文件,做Tophat时,发现警告“Warning: TopHat did not find any junctions in GTF file”。不知是.gtf 弄错了,还是细菌本来就没有junction.
我的gtf是这样的:
scaffold1majorCDS933254.–0gene_id “orf00001”; transcript_id “transcript_orf00001”;
scaffold1majorexon933254.–0gene_id “orf00001”; transcript_id “transcript_orf00001”;
scaffold1majorCDS933254.–0gene_id “orf00001”; transcript_id “transcript_orf00001”;
scaffold1majorstart_codon9395.–0gene_id “orf00001”; transcript_id “transcript_orf00001”;
scaffold1majorstop_codon32523254.–0gene_id “orf00001”; transcript_id “transcript_orf00001”;
2. Cufflinks的结果里只有FPKM,如果想要RPKM用什么软件做呢?还是cufflinks能算RPKM 只是我没找到。我看了manual,找不到北。
3. 我每个条件只有一组RNAseq, 没做生物重复。cuffdiff 能做出结果,但是这样的结果能用吗? 有没有其他软件能做? (你文中说“结果中没有差异表达基因”)
1.细菌本来就没有junction。junction是对于真核生物含有内含子的基因来说的。
2.Cufflinks应该是不能用于计算RPKM的,现在公认的是FPKM,RPKM算是过时的。
3.没有生物重复,则需要使用cufflinks 2.0版本的。高版本貌似必须有重复。
网友评论