前面介绍了
gtf
转bed6
格式的脚本(点我查看).但bed6
格式的注释文件包含信息有限,没有包含基因结构信息.下面介绍个来自RSeQC
的能够将gtf
格式的注释文件转为能保留转录本信息的bed12
格式的文件.
关于bed12
格式的详细说明链接: https://genome.ucsc.edu/FAQ/FAQformat.html#format1
这个将gtf
转为bed12
的脚本名为gtf2bed
,源码都在github
上,链接如下: https://github.com/ExpressionAnalysis/ea-utils/tree/master/clipper
或者也可以通过网盘直接下载: https://pan.baidu.com/s/1pLt1VPh .
使用方法很简单,就两个参数,一个是待转换的gtf文件,一个是输出文件名,拿hg19
的lncRNA
的注释文件gencode.v19.long_noncoding_RNAs.gtf
举例:
./gtf2bed gencode.v19.long_noncoding_RNAs.gtf >gencode.v19.long_noncoding_RNAs.bed
转玩后将gtf
和bed
格式的文件放到IGV里就可以查看lncRNA
的转录本信息:
上面是基因(gtf文件
),下面是每个基因所对应的转录本(bed12文件
).
更多原创精彩视频敬请关注生信杂谈:
网友评论