R package:RIdeogram (一)
R package:RIdeogram (二)
讲解了需要展示的数据和染色体基因密度数据的制备,这次再说说展示数据集的准备。
1.读取数据
myfiles <- list.files(pattern = "*st.txt")
myfiles
matrix<-read.table(myfiles[1],sep='\t',header=T,
stringsAsFactors = F)
1.1查看
head(matrix)
# Gene chromosome Start End
#1 Ptp4a1 chr1 30940303 30949877
#2 Rpl31 chr1 39367851 39371911
#3 C130026I21Rik chr1 85241286 85282883
#4 Tiprl chr1 165212286 165282659
#5 Diexf chr1 193104399 193130283
#6 Mrrf chr2 36135660 36190284
与R package:RIdeogram (一)例子不同的是,这次的数据已经有了6列中的3列:chromosome,Start和End。这样就好办多了,不需要通过biomaRt获取每一个基因的染色体坐标了。
1.2 查看目标数据集
head(Random_RNAs_500)
# Type Shape Chr Start End color
#1 tRNA circle 6 69204486 69204568 6a3d9a
#2 rRNA box 3 68882967 68883091 33a02c
#3 rRNA box 5 55777469 55777587 33a02c
#4 rRNA box 21 25202207 25202315 33a02c
#5 miRNA triangle 1 86357632 86357687 ff7f00
#6 miRNA triangle 11 74399237 74399333 ff7f00
可以看到还缺少3列内容。
第1列:基因类型,
第2列:标记的形状,有三种形状:box,三角形和圆,
第6列:标记的颜色。
2. 添加其他列
2.1添加第1列
matrix$type <- 'gene'
2.2 添加第2列
matrix$Shape <- 'triangle'
2.3 添加第6列
matrix$color <- '6a3d9a'
2.4 按照示例数据重拍列的顺序
Random_RNA<-data.frame(Type=matrix$type,#第1列,基因类型
Shape=matrix$Shape,#第2列,标记的形状
Chr=matrix$chromosome,#第3列,基因所在染色体ID
Start=matrix$Start,#第4列,基因所在染色体起始位置
End=matrix$End,#第5列,基因所在染色体终止位置
color=matrix$color)#第6列,标记的颜色
3. 读取染色体核型文件和染色体基因密度文件
mmu_karyotype <- read.table("mmu_karyotype.txt", sep = "\t",
header = T, stringsAsFactors = F)
mmu_gene_density <- read.table("mmu_gene_density.txt", sep = "\t",
header = T, stringsAsFactors = F)
4 .绘图
ideogram(karyotype = mmu_karyotype,#染色体核型文件
overlaid = mmu_gene_density,#基因密度文件
label = Random_RNA,#自己准备的第三个文件
label_type = "marker",
colorset1 = c("#fc8d59", "#ffffbf", "#91bfdb"))
convertSVG("chromosome.svg", device = "png")
网友评论