美文网首页
R package:RIdeogram (三)展示数据的准备

R package:RIdeogram (三)展示数据的准备

作者: 佳名 | 来源:发表于2020-04-23 19:30 被阅读0次

R package:RIdeogram (一)
R package:RIdeogram (二)
讲解了需要展示的数据和染色体基因密度数据的制备,这次再说说展示数据集的准备。

1.读取数据

myfiles <- list.files(pattern = "*st.txt")
myfiles
matrix<-read.table(myfiles[1],sep='\t',header=T,
                   stringsAsFactors = F)

1.1查看

head(matrix)
#           Gene chromosome     Start       End
#1        Ptp4a1       chr1  30940303  30949877
#2         Rpl31       chr1  39367851  39371911
#3 C130026I21Rik       chr1  85241286  85282883
#4         Tiprl       chr1 165212286 165282659
#5         Diexf       chr1 193104399 193130283
#6          Mrrf       chr2  36135660  36190284

R package:RIdeogram (一)例子不同的是,这次的数据已经有了6列中的3列:chromosome,Start和End。这样就好办多了,不需要通过biomaRt获取每一个基因的染色体坐标了。

1.2 查看目标数据集

head(Random_RNAs_500)
#   Type    Shape Chr    Start      End  color
#1  tRNA   circle   6 69204486 69204568 6a3d9a
#2  rRNA      box   3 68882967 68883091 33a02c
#3  rRNA      box   5 55777469 55777587 33a02c
#4  rRNA      box  21 25202207 25202315 33a02c
#5 miRNA triangle   1 86357632 86357687 ff7f00
#6 miRNA triangle  11 74399237 74399333 ff7f00

可以看到还缺少3列内容。

第1列:基因类型,
第2列:标记的形状,有三种形状:box,三角形和圆,
第6列:标记的颜色。

2. 添加其他列

2.1添加第1列

matrix$type <- 'gene'

2.2 添加第2列

matrix$Shape <- 'triangle'

2.3 添加第6列

matrix$color <- '6a3d9a'

2.4 按照示例数据重拍列的顺序

Random_RNA<-data.frame(Type=matrix$type,#第1列,基因类型
                       Shape=matrix$Shape,#第2列,标记的形状
                       Chr=matrix$chromosome,#第3列,基因所在染色体ID
                       Start=matrix$Start,#第4列,基因所在染色体起始位置
                       End=matrix$End,#第5列,基因所在染色体终止位置
                       color=matrix$color)#第6列,标记的颜色

3. 读取染色体核型文件和染色体基因密度文件

mmu_karyotype <- read.table("mmu_karyotype.txt", sep = "\t", 
                            header = T, stringsAsFactors = F)
mmu_gene_density <- read.table("mmu_gene_density.txt", sep = "\t", 
                               header = T, stringsAsFactors = F)

4 .绘图

ideogram(karyotype = mmu_karyotype,#染色体核型文件
         overlaid = mmu_gene_density,#基因密度文件
         label = Random_RNA,#自己准备的第三个文件
         label_type = "marker",
         colorset1 = c("#fc8d59", "#ffffbf", "#91bfdb"))
convertSVG("chromosome.svg", device = "png")

相关文章

网友评论

      本文标题:R package:RIdeogram (三)展示数据的准备

      本文链接:https://www.haomeiwen.com/subject/pozaihtx.html