基因注释文件在基因组分析过程中起这非常重要的参考作用,前面已经讲过一期gtf文件基本格式及列提取技巧,比如根据gene_name或gene_type提取某个基因信息或全部蛋白编码基因信息,但gtf文件太大且比较冗余,今天介绍个将gtf文件转为bed格式的脚本.
使用格式如下:
perl ./gtf2bed.pl gtf文件 输出文件名
脚本下载地址: https://github.com/kubranarci/gtf2bed
例如: gencode19版本的长非编码RNA的gtf注释文件转bed6格式:
gtf文件perl ./gtf2bed.pl gencode.v19.long_noncoding_RNAs.gtf a.bed
结果如下:
bed文件当然使用bedtool
的convert2bed
或gtf2bed
也是可以的.
更多原创精彩视频敬请关注生信杂谈:
网友评论