只做过小鼠的基因id转换,以前的教程写过,但是师弟的是羊的基因组,格式不规范。小鼠的不能用
试着直接读入
library('rtracklayer')
gtf_data = as.data.frame(import('Ovis_aries.Oar_v3.1.109.gtf'))#这里使用import导入gtf文件, 生成一个GRangs对象
gtf_data <- gtf_data[gtf_data$type=="gene",]
gtf_data <- gtf_data[,c(1:3,10,13,24)]
library('dplyr')
gtf_data <- distinct(gtf_data)#删除重复行
write.csv(gtf_data,"Ovis_aries.Oar_v3.1.109.csv")
![](https://img.haomeiwen.com/i550630/fa30ec60cb385d09.png)
整理发现大量的基因没有gene name!!!
两万多个基因,怎么到1000个有名字,不对劲啊
更新~~~~~~~~~~~~~~~
gtf注释里面就是没有提供很多基因名,找了很多人问,也没找到解释
后来使用在线网站转换把 没办法
网友评论